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This paper describes a vocoder for use in a speech communication system which transmits digital signuls 


at a rate of hâ00 bps. The vocoder is based on formant analysis-synthesis. The first formant, however, is 


transmitted in its original form. The second formant synthesis is done by so-called voice-excitation, and 


the third formant is noise-excited. This concept leads to a good balance between performance and complex- 


ity so that a useful system is obtained. 


INLEIDING 


Het overdragen van gespreksignalen in digitale vorm over 
telefoonverbindingen ondervindt een groeiende belang- 
stelling o.a. in verband met geheimhouding van gesprek- 
ken. Als het spraaksignaal eenmaal beschikbaar is in 
digitale vorm dan kan met een z.g. “scrambler" een hoge 
mate van geheimhouding verkregen worden. Vanwege de be- 
perkte bandbreedte van telefoonkanalen zijn slechts lage 
bitsnelheden mogelijk. Standaard bitsnelheden voor 
da*atransmissie over telefoonlijnen zijn o.a. 24600 bps, 
6800 bps en 9600 bps. Om gespreksignalen te kunnen co- 
deren met deze lage bitsnelheden en met behoud van een 
zo goed mogelijke spraakkwaliteit, moet men gebruik 
maken van spraak analyse-synthese systemen (vocoders). 

Om de complexiteit van het complete geheimhoudings- 
systeem binnen redelijke grenzen te houden, is gekozen 
voor een transmissiesnelheid van bä00 bps, Een trans- 
missiesnelheid van 2b00 bps zou een ingewikkelde vocoder 
vereisen, maar de datatransmissieapparatuur (de modem) 
kan eenvoudig zijn. Anderzijds zou bij een transmissie 
snelheid van 9600 bps volstaan kunnen worden met een 
eenvoudige vocoder, maar nu heeft men een complexe modem 
nodig, Een transmissiesnelheid van b600 bps echter, 
geeft aanleiding tot een systeem waarbij zowel de 


vocoder als de modem relatief eenvoudig kunnen zijn. 


SPRAAK EN FORMANTEN 


Aan de zendzijde van een vocoder wordt het spraaksignaal 
geanalyseerd, hetgeen een aantal relatief langzaam 
variërende parametersignalen oplevert. Aan de ontvang- 
zijde wordt het spraaksignael gesynthetiseerd welke 
synthese gestuurd wordt door de parametersignalen. 
Omdat de verschillende soorten spraakklanken op ver 
schillende wijze gesynthetiseerd moeten worden, maken 
we onderscheid tussen stemhebbende en stemloze klanken. 
De belangrijkste stemhebbende klanken zijn de klinkers. 
Een klinker ontstaat wanneer de mondholte akoes- 


tisch wordt aangestoten door luchtdrukimpulsern, welke 


gegenereerd worden met behulp van de stembanden. De 


frekwentie waarmee deze impulsen optreden, de grondtoon- 


frekwentie, kan zo ongeveer tussen 80 en 300 Hz variëren, 


Naast de grondtoon bevatten de impulsen een groot aantal 
harmonischen, welke in sterkte afnemen met de frekwentie. 


De mondholte vertoont in het algemeen een aantal 


resonanties, waardoor bepaalde delen in het spektrum van 


de impulsen sterk bevoordeeld worden. Zo'n resonantie 


wordt een formant genoemd. Fig. | geeft een voorbeeld 


van het spektrum van een klinker. Samenvattende 


wordt een klinker dus gekarakteriseerd door een 


grondtoonfrekwentie Fo en de frekwentieliggingen en 
relatieve sterkten van de formanten. Deze parameters 
kunnen slechts langzaam variëren omdat ze bestuurd worden 
door spierbewegingen. De tijdkonstante waarmee dit 


gebeurt is enkele tientallen milliseconden groot. 


Formanten 


Klinker 
spektrum 


8 SE — Frekw. 


Fig.l Spektrum van een klinker. 


In de band tot 3 ä bh kHz van het spektrum van een 
klinker treden normaal slechts drie formanten op. Tevens 
zijn er z.g. formantgebieden aan te wijzen : de eerste 
formant valt meestal in de band van 300 — 800 He, de 
tweede formant valt in een groot aantal van de gevallen 
in de band van B00 — 2000 Hz en de derde formant valt 
meestal in de band van 2000 — 3200 Hz (Flanagan 1965). 

In tegenstelling tot het spektrum van een klinker, 
welke in sterkte afneemt met de frekwentie, is het groot- 
ste gedeelte van de energie van stemloze klanken, zoals 
s en f‚ vertegenwoordigd in de band boven 2 kiz. Boven- 
dien vertonen deze klanken geen periodiciteit, zoals de 
klinkers. De stembanden trillen niet en de klank heeft 


een ruisachtig karakter. 
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DE VOCODER 


Het blokschema van de vocoder is weergegeven in Fig. 
Het spraaksignaal wordt met behulp van filters opge- 
splitst in drie kanalen welke ieder een van de formant- 
gebieden omvat. De gebruikte bandbreedtes voor dete 
formantkanalen zijn 300 — 800 Hz voor het eerste for- 
mantkanaal, 800 — 2000 Hz voor het tweede formantkanaal 
en 2000 — 3200 Hz voor het derde f'ormantkanaal. Aan de 
ingang van het systeem wordt het spraaksignaal eerst 
gedifferentieerd waardoor het gemiddelde frekwentie- 
spektrum van dit signaal min of meer vlak wordt. Hier- 
door kunnen aan de ingangsfilters dezelfde dempingseisen 
in het spergebied worden gesteld. In de praktijk blijkt 
dat een sperdemping van 30 dB voldoende is. 

Elk van de formanten wordt na analoge be- 
werking (analyse) toegevoerd aan een digitaliseringsin- 
richting. De verkregen digitale signalen worden door 
een multiplexer samengevoegd tot een synchrone data- 
stroom van b800 bps. Aan de ontvangzijde wordt deze 
datastroom aan een demultiplexer toegevoerd, waarna de 
digitale signalen gedecodeerd worden. De gedecodeerde 
formantkanalen worden elk na weer analoge be- 
werking (synthese) aan de uitgang toegevoerd. 

ha een verdere toelichting van de gebruikte filters 
worden de formantkanalen elk apart beschreven wat be- 
treft hun analoge gedeelten. De digitalisering van de 
verschillende signalen wordt in een aparte paragraaf 


beschreven. 


Fig. 2 Blokschema van de vocoder. 
Boven : zendgedeelte, 
onder : ontvanggedeelte., 
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De eisen die aan de filters gesteld worden zijn : een 
sperdemping van 2 30 dE, zoals reeds eerder genoemd, en 
een steile overgang tussen doorlaat en spergebied zodat 
een goede bandscheiding wordt. verkregen. Een geringe 
rimpel in het doorlaatgetied is geen bezwaar. Tevens 
streven we naar zo eenvoudig mogelijke filters. Een fil- 
tertype dat hieraan goed voldoet is een be-orde Cauer 
filter met een minimale sperdemping van 30 dB en een rim- 
pel in het doorlaatgebied van 1,25 dB. De op de afsnij= 
frekwentie genormeerde dempingskarakteristiek van dit 
filter is gegeven in Fig. 3. Naast de laagdoorlaat- 
karakteristiek is in Fig. 3 ook de hoogdoorlaatkarakteris- 
tiek weergegeven. Omdat RC-aktieve Filters zijn toegepast, 
is geen direkte transformatie mogelijk van laagdoorlaat 
naar banddoorlaat. Daarom zijn de bandfilters elk opge- 
bouwd uit een cascade van een laagdoorlaatfilter en een 
hoogdoorlaatfilter. 

Alle filters in de vocoder zijn van het boven be- 
schreven type, alleen de laagdoorlaatfilters 0 — 15 Hz 
zijn van een eenvoudiger type. Deze laatste worden in de 


beschrijving van de formantkanalen nader toegelicht. 


dB 
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Fig. 3 Genormaliseerde dempingskarakteristieken van de 
gebruikte filters. 


le- Formantkanaal 


Het eerste formantsignaal wordt zonder bandbreedtebe- 
perking overgezonden. Dit heeft twee redenen. Ten eerste 
verschaft dit een stuk natuurlijke spraak aan de ont 


vangkant, wat de verstaanbaarheid zowel als de natuurlijk- 


heid van het spraaksignaal zeer ten goede komt. Ten 
tweede bevat dit kanaal grondtooninformatie waarvan met 
vrucht gebruik gemaakt kan worden voor de natuurgetrouwe 
synthese van het tweede formantsignaal, waarop wel 
bandbreedte beperking wordt toegepast. 

Het eerste formantkanaal is niet uitgerust met 
bandfilters maar met laagdoorlaatfilters en modulatoren. 
Dit vindt zijn oorzaak in de digitalisering van het 
eerste formantsignaal. De nauwkeurigheid waarmee dit 
signaal gedigitaliseerd wordt, wordt voornamelijk be- 
paald door de verhouding van de bitsnelheid van het 
gedigitaliseerde signaal en de hoogste frekwentie die 
in het analoge signaal voorkomt. De modulatietrap ver- 
schuift met behulp van een draaggolfsignaal van 900 Hz 
het eerste formantsignaal van de band 300 — 800 Hz naar 
de band 100 — 600 Hz. De genoemde verhouding wordt hier- 
door verbeterd met een niet te versmaden faktor 
B00/600 = 1,33. 

Aan de ontvangstzijde wordt het signaal weer naar 
de oorspronkelijke band verschoven met een soortgelijke 


modulatietrap. 


de-Formantkanaal 


Bij de analyse van het tweede formantsignaal worden 


twee grootheden gedetekteerd : de formantamplitude en 

de formantfrekwentie, Zoals in Fig. bh is aangegeven, 
bestaat de amplitudedetektor uit een dubbelfasige ge- 
lijkrichter en een laagdoorlaatfilter. Dit laagdoorlaat- 
filter bestaat uit een enkele RC-sectie met een 3 dB- 
afsnijfrekwentie van 15 Hz. 

De frekwentiedetektor is gebaseerd op het meten 
van het aantal nuldoorgangen van het signaal per tijds- 
eenheid. Als er een enkele formant in het kanaal aan- 
wezig is, dan is de golfvorm Alt) van het formantsignaal 
zoals aangegeven in Fig. hb. Het formantsignaal lijkt op 
het signaal van een door een impuls aangestoten reso- 
nantiekring. Dit is volledig in overeenstemming met het 
gegeven model van de produktie van klinkers. Het formant- 
signaal Alt) is periodiek met de grondtoonfrekwentie Fo 
en de nuldoorgangen worden hoofdzakelijk bepaald door de 
formantfrekwentie F. Ter verduidelijking is ook het bij 
Alt) behorende frekwentiespektrum Alf) weergegeven in 
Fig. b. 

Het circuit van de frekwentiedetektor bevat een 
clipper welke een tweewaardig signaal afgeeft en zodoende 
uitsluitend de nuldoorgangen van het formantsignaal 
handhaaft. Aan de ingang van de clipper wordt een klein 
signaaltje met een frekwentie van ca. 1b00 Hz toege 
voegd. Gedurende aanwezigheid van een spraaksignaal is 
het formantsignaal zo sterk dat dit hulpsignaaltje de 
tijdstippen van de nuldcorgangen van het formantsignaal 
nauwelijks beïnvloedt. Gedurende pauzes echter, werkt de 
clipper op de nuldoorgangen van het hulpsignaaltje zodat 


de detektor dan toch een gedefinieerde waarde zal af 


Alt) 


Fig. b Boven : Principeschema van de gebruikte formant- 
analysator. 
Onder : Tijd-en frekwentiefunkties van een karak- 


teristiek formantsignaal. 


geven. De flanken van het geclipte signaal triggeren een 
impulsgenerator welke op elke flank een impuls afgeeft 

van konstante tijdsduur en amplitude. Het laagdoorlaat— 
filter geeft de gemiddelde waarde 
af welke dus evenredig is met de formantfrekwentie. Het 


van deze impulsreeks 


filter bestaat uit een enkele RC-sectie met een 3 dB- 
afsnijfrekwentie van 15 Hz. 

Op bovenstaande wijze is de bandbreedte van het 
formantsignaal, welke 1200 Hz omvat, teruggebracht tot 
enkele tientallen Herzen, 

Aan de ontvangzijde wordt het formantsignaal ge - 
synthetiseerd met behulp van een resonantiekring waarvan 
de resonantiefrekwentie wordt geregeld door de ontvangen 
frekwentieregelspanning (Flanagan 1960). Deze resonantie- 
kring bootst de eigenschappen van de mondholte voor 
klinkers na, althans in het tweede formantgebied. Het 
circuit van de afstembare resonantiekring bestaat uit 
twee tegengekoppelde operationele versterkers en een 
variabele versterker met versterking -A. Zie Fig. 5. 


De overdrachtsfunktie Hp) van het circuit is : 
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De resonantiefrekwentie 4), de kwaliteitsfaktor q, de 
bandbreedte B en de versterking bij): EW), worden 
gegeven door de betrekkingen welke eveneens in Fig. 5 
zijn weergegeven. Hieruit blijkt dat, gevariëerd kan 
worden door de versterking A te variëren. Aangezien de 


ontvangen frekwentieregelspanning F‚, recht evenredig is 


ë 
met de formantfrekwentie, moet A dus kwadratisch ge- 


regeld worden : 


waarin k een passende konstante voorstelt. Nu wordt @, k 


NE ME 
EE AC 


De resonantiefrekwentielW, volgt zodanig de in de zender 
gemeten formantfrekwentie F, De bandbreedte van de kring 
is ongeveer 100 Hz gekozen, overeenkomende met de Ee 


middelde bandbreedte van de tweede formant. 


Fig. 5 RC-aktieve realisatie van de afstembare reso- 
nantiekring. De afstemming geschiedt door de 


versterkingsfaktor A te variëren. 


De resonantiekring wordt via een amplitudemodulator aan- 
gestoten door het vervormde eerste formantsignaal. 
Deze vervorming wordt bewerkstelligd door een clipper. 
Het vervormde signaal bevat harmonischen van de grondtoon 
die aanwezig is in het eerste formantsignaal. Op deze 
wijze blijft de periodiciteit, of grondtooninformatie, 
in de tweede formant gehandhaafd. Men kan i.p.v. een 
clipper ook andere niet-lineaire circuits toepassen zo- 
als bijv. een gelijkrichter, maar een clipper heeft het 
voordeel dat deze niveau-variaties van het eerste for- 
mantsignaal elimineert zodat een gelijkmatiger aansteten 
van de resonantiekring verkregen wordt. De juiste niveau- 
variaties in de tweede formant worden bewerkstelligd door 
het uitgangssignaal van de clipper te moduleren met de 
ontvangen amplituderegelspanning. 

Het uitgangssignaal van de resonantiekring wordt 
aan de uitgang van het systeem toegevoerd via een hoog- 
doorlaatfilter met een afsnijfrekwentie van BOO Hz. Dit 
filter elimineert eventueel aanwezige signaalcomponenten 


in het eerste formantgebied. 
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je=Formantkanaal 


Uit de beschrijving van het tweede formantkanaal blijkt 
dat dit kanaal uitsluitend is ingericht voor de over- 
dracht van stemhebbende klanken, en in het bijzonder van 
klinkers. De relatieve bijdrage van de derde formant tot 
gemiddeld ca. -25 dB 
(Peterson 1952). Het is daarom logisch om het derde 


een klinker is slechts gering : 


formantkanaal niet te gebruiken voor deze kleine bijdrage, 
maar voor de overdracht van stemloze klanken, die juist 
in dit frekwentiegebied een groot gedeelte van de energie 
hebben. Daarom wordt de derde formant ontvanger niet aan 
gestoten door het vervormde eerste formantsignaal, maar 
door een ruisbron. Door deze maatregel heeft het nagenoeg 
geen effekt meer om de resonantiefrekwentie van de kring 
in de derde formant ontvanger te variëren. Hierdoor komt 
het gehele frekwentiekanaal te vervallen. 

De zendzijde van het derde formantkanaal bestaat 
naast het ingangsfilter nog slechts uit een amplitude- 
detektor. 

De ontvangzijde bestaat uit een vaste resonantie= 
kring welke aangestoten wordt door een met het ontvangen 
amplituderegelsignaal gemoduleerde ruisbron. De resonan- 
tiefrekwentie van de kring is 2500 Hz en de bandbreedte 
is 200 Hz. Tenslotte wordt het signaal, via het 800 Hz- 
hoogdoorlaatfilter, aan de uitgang toegevoerd. Het sig= 
naal uit de somvormer wordt aan een integrator toegevoerd 
welke de differentiator aan de ingang van de zender com- 


penseert. 


Digitalisering 

De digitalisering van de regelsignalen in de tweede en 
derde formantkanalen gebeurt met lineaire PCM. De signalen 
worden aan een analoge multiplexer toegevoerd, welke de 
drie signalen om beurten doorschakelt naar de ingang van 
de PCM-coder. Deze coder bemonstert zijn ingangssignaal 
met 150 Hz, zodat de regelsignalen elk met 50 Hz bemon- 
sterd worden. De signaalmonsters worden elk gekwantiseerd 
met hb bits, zodat per kanaal een bitssnelheid van 200 bps 
ontstaat. Het uitgangssignaal van de coder bestaat dus 
uit een 600 bps datastroom. 

Aangezien de beschikbare transmissiecapaciteit 
h800 bps is, blijven er nog k200 bps over voor het digi- 
taliseren van het eerste formantsignaal. 

Het codeer-principe dat we gebruiken voor het digi 
taliseren van het eerst formantsignaal is edaptieve PCM 
(APCM), (Wilkinson 1971). Het signaal wordt bemonsterd met 
1400 Hz en elk monster wordt gekwantiseerd met 3 bits, 
echter zodanig dat de kwantiseringsniveau's zichzelf aan- 
passen aan het niveau van het ingangssignaal. Fig. 6 geeft 
het vereenvoudigde blokschema van de APCM-coder. 

De zeven te onderscheiden niveau's worden aan de compara- 
tors toegevoerd d.m.v. een weerstandsdeling van de regel- 


spanning Ns De uitgangsspanningen van de comparators 


worden in de binaire converter omgezet in een 3-bits re- 
presentatie van de aan de regelspanning gerelateerde 


ingangssignaelwaarde. Het uitgangsregister wordt op de 


Fig. & Vereenvoudigd schema van de APCM=coder. 


Fig. 7 Vereenvoudigd schema van de APCM-decoder. 


bemonsteringstijdstippen getriggerd met een 1400 He 
kloksignaal F_… De regelspanning V‚ wordt opgewekt m.b.v. 


een exclusive — or schakeling en een integrator. De in 


Fig. 6 aangegeven tabel van de mogelijke 3-bits woorden 
bevat twee stippellijnen welke symbolisch drempels weer 
geven. Als er een APCM-woord wordt gecodeerd (in het 
uitgangsregister verschijnt) dat buiten de drempels ligt, 
dan geeft de exclusive-or schakeling een impuls af die 
aan de integrator wordt toegevoerd, Hierdoor neemt Vv, toe. 
Wordt er een APCM-woord gecodeerd dat binnen de drempels 
valt dan wordt er geen impuls aan de integrator toege- 
voerd en Vv. neemt hierdoor af. De tijdkonstante van de 
integrator is ong. 6 msec. en de tijdsduur van de im- 
pulsen die door de exclusive-or schakeling wordt afge- 
geven is 1/1400 sec. De regelspanning zal de omhullende 
van het ingangssignaal volgen, zodat ook de kwantiserings- 
niveau's in grootte meevariëren met de amplitude van het 
ingangssignaal. 

De digitale multiplexer (zie Fig. 2) voegt de twee 
bitstromen van b200 bps en 600 bps samen tot een synchro- 
ne bitstroom van b800 bps. In de ontvanger worden deze 
bitstromen weer opgesplitst d.m.v. de demultiplexer. 

De synchronisatie van de demultiplexer laten we buiten 
beschouwing. 

In de APCM-decoder, zie Fig. T, wordt op dezelfde 
wijze als in de APCM-coder, de regelspanning Ln weer op= 
gewekt. Het uitgangssignaal van de decoder wordt ver 


kregen door Ve te vermenigvuldigen met de waarde van het 


Fig. Ö Cadeer-karakteristiek van het APCM-systeem. 


ontvangen APCM-woord. Dit kan men eenvoudig realiseren 
met een weerstandsnetwerk en drie schakelaars, zoals In 
Fig. T is weergegeven. De verkregen codeer-karakteris= 
tiek van het APCM systeem is weergegeven in Fig. 8, Vv. 
stelt het ingangssignaal van de coder voor en Ln het uit= 
Eangssignaal van de decoder. 

De lineaire PCM-decoder genereert de betreffende 
regelspanningen. De analoge demultiplexer verdeelt deze 


regelspanningen naar de juiste kanalen. 


il 


RESULTATEN 


Bij het beoordelen van de kwaliteit van de vocoder maken 
we onderscheid tussen de verstaanbaarheid, de natuur- 
lijkheid of de herkenbaarheid van de spreker en de ge- 
voeligheid van de vocoder voor transmissiefouten. 

Uitgebreide verstaanbaarheidsproeven zijn niet ge- 
daan, maar informele luisterproeven tonen aan dat de 
verstaanbaarheid ronduit goed is. Dit wordt vooral 
verkregen door het rechtstreeks overzenden van het 
eerste formantsignaal en het medesynthetiseren van de 
stemloze klanken, De aanwezigheid van het oorspronke- 
lijke eerste formantsignaal aan de ontvangzijde draagt 
ook grotendeels bij tot de natuurlijkheid. 

In feite zijn in deze vocoder twee klassieke 
vocoder problemen omzeild. Deze problemen hebben be- 
trekking op het verkrijgen van het juiste excitatie- 
signaal voor de synthetisator. Enerzijds moet de 
synthetisator aangestoten worden met impulsen die in 
exact de goede grondtoonfrekwentie opgewekt moeten 
worden wanneer stemhebbende klanken gesproken worden. 
Anderzijds, bij stemloze klanken, zou men de synthe- 
tisator moeten aanstoten met ruis. Om dit te bewerk- 
stelligen heeft men een detektor nodig die aangeeft of 
de gesproken klank stemloos of stemhebbend is. Bovendien 
heeft men voor het geval dat de klank stemhebbend is, 
een detektor nodig die aangeeft hoe groot de grondtoon- 
frekwentie precies is. Beide detectors zijn niet be- 
trouwbaar te realiseren zonder zeer ingewikkelde appa- 
ratuur, In de beschreven vocoder worden de verschillende 
excitatiesignalen niet op verschillende tijdstippen aan 
de synthetisator toegevoerd, maar gelijktijdig in ver 
schillende frekwentiebanden. Wanneer een klinker wordt 


ingesproken, wordt aan de ontvangkant in het derde for- 
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mantkanaal ruis gegenereerd op een laag niveau, overeen- 
komstig de sterkte van de relatief zwakke derde formant. 
De signalen in de eerste en tweede formantkanalen, welke 
beide de goede grondtoon bevatten, domineren nu. Bij 
stemloze klanken daarentegen domineert het ruissignaal 
uit het derde formantkanaal. Op deze wijze verkrijgt men 
een "gladde!" overgang van stemhebbende naar stemloze 
klanken en omgekeerd. 

De gevoeligheid voor transmissiefouten is gering. 
Bij een foutenkans van 1075 in de overgezonden bitstroom 
merkt men nauwelijks enige invloed. Bij een foutenkans 


van 3.103 merkt men verstoringen op, speciaal tijdens 


de spraakpauzes. Bij een foutenkans van 1075 


is het sys- 
teem nog steeds bruikbaar, maar storing in het spraak 
signaal is duidelijk aanwezig. Bij foutenkansen van 
3,407 en hoger, wordt het spraaksignaal zodanig aange 


tast dat de verstaanbaarheid grotendeels verloren gaat. 
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REDUCTIE VAN SPRAAKBANDBREEDTE MET BEHULP VAN EEN 
VOCODER DIE GEBRUIK MAAKT VAN VOORUITREGELING 
Ir. K.E. Kuijk, Dr.Ir.N.V. Franssen 


Philips Research Laboratories 


Eindhoaven,The Netherlands 


À new type of a voice-excited vocoder is deseribed. A part of the receiving system has been 


copied in the transmitter system, so that signals can be generated for control of artificial frequency 


bands in order to agree in energy level with the corresponding frequency bands of the original speech. 


Inleiding 
Voor een goede verstaanbaar van spraak is 


tenminste een bandbreedte van 300 — 3200 Hz noodzakelijk. 


In vele gevallen, b.v. bij transatlantische telefonie, 
zou men deze bandbreedte nog willen reduceren. 

Dit kan met een vocoder, In dit artikel 
wordt een zogenaamde voice=excited vocoder beschreven. 
In een dergelijk systeem wordt een deel van de 
spraakband rechtstreeks overgezonden. Aan de ontvang- 
zijde wordt dit deel dan tevens gebruikt om het 


overige deel van het spectrum te reconstrueren. 


1. De opbouw van spraakklanken 
Spraak bestaat uit een reeks elkaar opvol- 


gende klanken; klinkers en medeklinkers. 

Deze klanken kunnen een grote mate van 
periodiciteit hebben — ze hebben dan een duidelijke 
toonhoogte = of niet, b.v. de letters s,t,f‚p‚g,k of 
gef luisterde spraak. 

In beide gevallen echter blijkt de trillingsenergie zich 
hoofdzakelijk in een tweetal frekwentie domeinen te 
bevinden, de zogenaamde formanten, die voor een 
bepaalde spraakklank karakteristiek zijn. Zo geeft 

fig. | de ligging aan van de formanten van de 

klinkers die elkaar gedeeltelijk overlappen. 

Daar wij onze mondstand n.l. slechts 
betrekkelijk langzaam kunnen veranderen, zal ook de 
spectrale inhoud van spraak slechts langzaam ver- 
anderen. Daar bovendien ons gehoororgaan over terts= 
bandbreedtes integreert zal exacte overdracht van 
de frequenties niet nodig zijn maar is reproductie van 
formanten binnen de nauwkeurigheid van een tertsband- 
breedte voldoende om verstaanbare spraak te ver- 
krijgen. Hierin ligt nu een mogelijkheid voor 
bandbreedte reductie. 


Wel is vaak het onderscheid "toonhoogte 


hebbend of niet! moeilijk automatisch vast te stellen. 
De moeilijkheden hiervan zijn te omzeilen door een vol- 
doend groot gedeelte van de spraakband rechtstreeks over 
te zenden en hieruit met behulp van aan de zendzijde 
gevormde regelsignalen het gehele spraakspectrum te 
reconstrueren, zodat de periodiciteit behouden blijft. 


Dit noemt men een voice-excited vocoder. 


2, Het principe van de spraakband reductie 
Het hier te beschrijven systeem is zo een 


voice-excited vocoder. Als direct over te zenden band 
nemen we het gebied van 200 — 800 Hz, waarvan de onderste 
grens gegeven wordt door toevallig aanwezige filters; 
hierin is dan praktisch altijd de eerste formant aan- 
Wezlg. 

Zowel aan de zend- als ontvangstzijde wordt 
deze grondband op onderling identieke wijze vervormt 
teneinde hieruit een frequentie band van 800 — 3200 Hz 
af te leiden die zo goed mogelijk gelijkmatig gevuld is. 
Dit signaal heeft dan dezelfde periodieke structuur als 
de oorspronkelijke spraak daar het uit het belangrijkste 
gedeelte hiervan is afgeleid. Dit lukt heel aardig 
door de 200 — 800 Hz band eerst dubbel gelijk te richten; 
via een capacitieve koppeling peak-clipping toe te 
passen en vervolgens dit signaal te differentiëren. 

Aan de zendzijde worden nu met behulp van 
tweemaal een zestal tertsfilters zowel het spraak- 
gedeelte van 800 — 3200 Hz als het kunstmatige signaal 
in telkens zes banden opgesplitst. De gemiddelde 
amplitude aan de uitgangen van overeenkomstige terts- 
filters worden nu onderling vergeleken en hieruit worden 
regelsignalen afgeleid. Ook aan de ontvanstzijde wordt 
het kunstmatige signaal met behulp van tertsfilters in 
de zes overeenkomstige tertsbanden gesplitst. Daar 
de kunstmatige band aan de ontvangstzijde door de 


onderling gelijke bewerking exact gelijk is aan die 
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van de zendzijde, zijn de regelsignalen een nauw- 
keurige aanwijzing voor wat er aan de ontvangstzijde 
aan de gemiddelde amplitudes van de signalen uit 

de tertsbanden moet veranderen om dezelfde amplitudes 
te verkrijgen als van de signalen uit de tertsbanden 
van de oorspronkelijke spraak. 

Daar de amplitudes in de tertsbanden niet 
snel kunnen veranderen kunnen de regelsignalen 
begrensd worden tot een bandbreedte van minder dan 
50 Hz. Men kan dus volstaan met het overzenden 
van de oorspronkelijke grondband van 200 — 800 Hz 
en de zes regelsignalen. Aan de ontvangstzijde 
worden de gemiddelde amplitudes uit de zes terts- 
banden met behulp van regelversterkers door de 
corresponderende regelsignalen geregeld. Na 
samenvoeging van de grondband en de zes aldus 
gereconstrueerde deelbanden heeft men weer een zeer 
verstaanbare spraak herkregen die met slechts 


ongeveer 1000 Hz bandbreedte is overgezonden. 


3. Het amplitude regel systeem 

Tot de belangrijkste onderdelen van het 
systeem van Fig. 2 behoren de regelcircuits voor de 
amplitude. 
Het eerste voorstel over dit uit te voeren is aan= 
gegeven in Fig. 3 en maakt-gebruik van een ver- 
menigvuldiger in een terugkoppellus. Het signaal 
Va wordt gelijkgericht en na filtering in een 
laagdoorlaatfilter wordt een spanning evenredig 
met de amplitude v, (voor sinusvormige signalen) 


verkregen. Het signaal V‚ wordt via een vermenig= 


B 
vuldiger in een overeenkomstige schakeling gestuurd. 
De beide signalen overeenkomend met de amplitudes, 

worden vergeleken in een verschilversterker en deze 


Kad 


stuurt de vermenigvuldiger tot er geldt M x Va = Ve 
Het nadeel van deze methode is dat de versterking in 
de regellus verandert als funktie van de amplitudes. 
Daardoor is de nauwkeurigheid niet konstant, en 


tevens kan de maximale open lus versterking niet 


te groot zijn wegens gevaar voor parasitair oscilleren. 


Om de rimpel op het regelsignaal Ne klein te houden 
zijn er tweede of hogere orde laagdoorlaatfilters 
nodig en deze geven ook aanleiding tot oscilleren van 
de regellus; dit kan wel gedeeltelijk voorkomen worden 
door dubbelzijdige gelijkrichting toe te passen. 

Een veel direktere methode, die al deze 
nadelen niet heeft, is aangegeven in Fig. hb. Hierbij 
worden beide signalen gelijkgericht in een (enkel- 
zijdige) gelijkrichter en via laagdoorlaatfilters van 
tweede- of hogere orde worden de amplitude informaties 
in de vorm van gelijkspanningen verkregen. Veronder- 
stellen we voor het gemak dat V, = v cost,t en Vs = 


Â Â A 


Va cost, dan zijn deze gelijkspanningen dus even= 
de 


redig met V‚ en Ln Vervolgens worden hiervan in 


7á 


legarithmische omzetters spanningen gemaakt evenredig 


met In NAP en ln ValVos waarbij V, een referentie- 


C 
spanning is, en deze worden van elkaar afgetrokken, 

ke a 
zodat er een spanning evenredig met In Valve ontstaat. 
Als hiermee in een exponentiële vermenigvuldiger het 


Be 
BE Va cos ot gestuurd wordt, is het resultaat 
de 


A Eje ae 
Va cosa,t.e exp In V/a = Vv, cost, d.w.z. het signaal 


signaal V 


met. frekwentie w, krijgt de amplitude V‚ van het signaal 


met frekwentie A 

In de experimentele schakeling, opgezet om de 
verstaanbaarheid te toetsen, is het signaal In NA als 
regelsignaal gebruikt. Bij b.v. een telefoniesysteem 1s 
het niet goed mogelijk om dit signaal In 1/7 over te 
zenden, omdat een eventuele verzwakking op de lijn 
aanleiding geeft tot een signaal aan de uitgang van de 


exponentiële vermenigvuldiger (aan de ontvangkant): 


K AAA Vi et 
Vg cosupt. e = ) . Vo cosut 


en dus niet tot het beoogde resultaat leidt. Deze 
moeilijkheid is te vermijden door een pilot signaal mee 
over te zenden die een bepaalde bekende amplitude moet 
hebben aan de ontvangstzijde en dus voor bijregeling 
kan zorgen of door het signaal In V/d, eerst op een 
exponentiële versterker te zetten. Het signaal even-= 
redig met NLA dat dan ontstaat, kan mannen Dienst 
zonden. In de ontvanger wordt het signaal V‚/V, op 
een logarithmische omzetter gezet; het uitgangssignaal 
in et ValVa wordt gebruikt als regelsignaal A AR 
exponentiële Vermenieenldigee on het signaal Vs cost 
te sturen. Er ontstaat dan ef V, cost, d.w.z. het 
gewenste resultaat, afgezien van een zekere verzwakking 
ol, 

In het volgende gedeelte zal de manier, waarop 
de elektronische deelschakelingen gerealiseerd zijn, 


besproken worden. 


hl, De gelijkrichtschakeling 

In Fig. 5 is de gebruikte gelijkrichtschake- 
ling getekend. Het is een enkelzijdige gelijkricht- 
schakeling. De schakeling is in de praktijd belast 
met een 2e orde laagdoorlaatfilter, waarvan hier de 
eerste sektie is getekend. Om nu het opladen en ont- 
laden van de kondensator via eenzelfde weerstand te 
doen verlopen is een emittervolger i.p.v. een diode 
opgenomen in de terugkoppelleiding. De nauwkeurigheid 
van deze gelijkrichter is ongeveer 5% over een gebied 
van 73 dB (1 mv — 5 Vv). 


5, De logarithmische omzetters 
In Fig. 6 is het schema van een logarithmische 
omzetter getekend. Voor de transistoren q, en 4 geldt 


de exponentiële transistor karakteristiek 


met : k = konstante van Boltzmann 
T = abs, temp. 
q = lading van het electron. 


en waarbij Ios „ de verzadigingsstroom is van resp. Q, 
sE 

en Q,. Als de ingangsstroom I, van de operationele 

versterker verwaarloosbaar is, geldt er : 

de 


v 


| Tk | 
4 
zodat 
mi 
k.T Vv 
L Ä 
be1 a Io1E4 


Een analoge formule kunnen we afleiden voor de 


bewerking van het signaal Va : 


Pe 
k.T v. 
ë B 


Âls nu de transistoren a, en Qo een paar identieke 
geintegreerde transistoren zijn, vlak bij elkaar in 
Eén I.C., dan geldt dat Is en Io goed aan elkaar 
gelijk zijn, met een onnauwkeurigheid van hè, en dat 
de temperaturen T, en Ts aan elkaar gelijk zijn. 

In dat geval geldt, als Ry = Ry 


k.T, Vv 


A 
s ” ‘bet “'be2 * Ta che: (5) 


In de experimenteleschakeling is dit signaal Ve als 
regelsignaal voor de experimentele vermenigvuldiger 


gebruikt. 


6. De exponentiële vermenigvuldiger 
De exponentiële vermenigvuldiger is aange= 
geven in Fig. T. In deze schakeling ia 3, weer 
een geïntegreerd transistorpaar. Er geldt weer de 
exponentiële transistorkarakteristiek : 
NE „Vrez/keT; 
e5 05" 
Poes) kT, 


3 ml 
I eer Tg 


waarbij weer geldt 


I = I TT 
Le | 


oj 4 À ä 


c5 mm In3°® 


In de experimentele situatie is het regelsignaal Ve 


uit 9): Va = Vie Tevens is in dat 


dus geeft (5) in (7) 


gelijk aan V 
geval T., = T 


5 


3 1 
EL 
le4 * Joz * 9% (8) 
b: 
Is 13” 13 ta (9) waarbij Vo het wisselspannings- 
signaal is, dan is het kollektorsignaal Fen 
Va v‚/V 
Y = RH LJ = É nd NN 10 
en sa ap RA zt zo) AB (10) 


Het wisselspanningssignaal dat door de CR-koppeling 


wordt doorgelaten is 


R 
_e4 vA | 
vs Ee tpi VAL (11) 


d.w.z. het signaal Va krijgt de amplitude van het 
signaal Vis zoals de opzet was. In deze vorm is de 
vermenigvuldiger dus in de experimentele situatie 
uitgevoerd. (Fig. 8). In een praktische situatie 
d.w.z. met tussenschakeling van een telefonielijn, 
ontbreekt in de vermenigvuldiger aan de zendzijde 


weerstand Bg. Dan wordt vergelijking (10) 


ä A 
Vau c4* Iz V/T (12) 


en dit signaal kan wel overgezonden worden. 

Aan de ontvangzijde wordt Ne (met een eventuele 
verzwakking ) weer op een logarithmische omzetter gezet 
van de vorm zoals besproken in Hoofdstuk V, tezamen 

met een hulpspanning Ru'1's (= Ruiz) Er ontstaat 

dan een spanningsverschil aan de uitgang van de 
logarithmische omzetter gelijk aan ln V‚/Vo welke weer 
gebruikt wordt als regelsignaal om een exponentiële 


vermenigvuldiger gelijk aan die uit Fig. 8 te sturen. 


T. Meetresultaten 
In Fig. 9 is het gebied aangegeven waarin de 


twee signalen V, en Vo zieh mogen bewegen, zoals gemeten 


in de en KE d.w.z. met de logarith= 
mische omzetters direkt aangesloten op de exponentiële 
vermenigvuldigers (Fig. 9). 

Om de onderlinge gelijkheid van de regel= 
systemen na te gaan, werd een in frequentie variërende 
sinusvormige trilling gelijktijdig en in gelijke 
grootte aan de drie tertsfiltersets toegevoerd. Fig. 
10 geeft de responsie aan de uitgang van de ontvangst- 
zijde aan. 

Tenslotte kan met een afluistertest van een 
onbekend fragment spraak de verstaanbaarheid van het 


gereconstrueerde spraaksignaal nagegaan worden. 
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ADAPTIEVE COMPENSATIE VAN ECHO OP TELEFOONLIJNEN 


ir. 


H. van Noort 


Dr. Neher Laboratorium 


This paper deals with problems of echo and delay time as they are experienced on long international 


connections. The difficulties which arise with the present voice switched echo suppressors are shortly 


described, The problems caused by the voice-operated switches can be avoided with the adaptive echo- 


canceller, generating a signal equivalent to the echo and using this to cancel the real echo. The 


principles of the adaptive echo=canceller are explained and some information about a practical 


realisation is given. 


‚ ECHO OP TELEFOONVERBINDINGEN 


In fig. |l is een telefoonverbinding schematisch 
weergegeven. Om een lange afstand zonder al te veel 
demping te overbruggen wordt gebruik gemaakt van een 
versterkte verbinding (D-E). In de uiteinden van de 


verbinding worden om economische redenen onversterk- 


te tweedraadsverbindingen toegepast (CD en EF). In 


Fig. 1: Schematische weergave van een 
telefoonverbinding met echo's. 
het toestel wordt deze tweedraadsverbinding weer 
vierdraads voor de microfoon (M) en de telefoon (T). 
De verschillende overgangen tussen vierdraads=- en 
tweedraadsverbindingen worden gemaakt met de vorken 
H Ee a H Li 
I & 


overloop van ene naar de andere vierdraadszijde 


Dit zijn brugschakelingen waarbij de 


meer gedempt wordt naarmate de impedantie van de 
tweedraadszijde meer gelijk is aan de impedantie 
van de vorkbalans. 

De vorkbalans is een eenvoudig netwerkje, dat de 
gemiddelde impedantie van de tweedraadszijde bena- 
dert. De impedantie van de tweedraadszijde wordt 
o.a, gevormd door allerlei verschillende soorten 
kabels van verschillende lengten. Daardoor is er 
aanzienlijk verschil tussen de impedantie van de 
balans en van de tweedraadszijde met als gevolg dat 
signalen bij de vork overlopen die als echosignalen 
bij de spreker terugkomen. Wanneer iemand via de 
telefoon spreekt, hoort hij zijn eigen stem via de 
normale weg van mond tot oor (Eo) en via de reflec- 


ties El tot E5. Deze reflecties zijn niet hinderlijk 


IE, 


zolang ze een verwaarloosbare vertraging hebben; dit 
is het geval voor Eo en El en meestal voor E2. De 
reflecties E3, E4 en E5 hebben echter een vertraging 
van meer dan twee maal de propagatietijd tussen D! 
en El en deze tijd is niet altijd verwaarloosbaar. 
De hinderlijkheid van de echo is groter naarmate de 
vertragingstijd groter en de demping kleiner is. 

Een illustratie hiervan wordt gegeven in fig. 2, 
(Richards '63). 


demping 
akoestisch) 22 


| 


cän) Fercentage van het aantal 
telefoongebruikers dat de 


echo bezwaarlijk windt, 


0 10 20 30 40 50 60 =vertragingstijd heen en cerug(ms}) 


Fig. 2: Kwaliteitswaardering van 
verbindingen met echo. 


In de praktijk bedraagt de overloopdemping van de 
vork 10 — 20 dB, voor de akoestische demping komt 
hier nog + 4 dB bij voor het toestel en 2 — 1á dB 
voor de rest van de verbinding dus totaal 16 — 38 
dB, Met deze gegevens blijkt uit fig. 2 dat maat- 
regelen tegen echo nodig zijn voor vertragingstij- 


den > 25 msec. 
LOOPTIJD VAN TELEFOONVERBINDINGEN 


Bij kabelverbindingen kunnen afstanden tot 20.000 
km voorkomen, de propagatiesnelheid is ongeveer 
165 km/sec zodat een looptijd van 120 msec (240 
msec voor heen en terug) kan optreden. Voor een 
afstand Amsterdam — New York van + 5000 km is de 


looptijd 35 msec (70 msec heen en terug). Voor de 
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telefoongebruiker is de looptijd heen en terug 

van belang zodat we in het vervolg alleen deze 
waarde zullen geven. Bij het gebruik van statio= 
naire satellieten moeten veel grotere afstanden 
overbrugd worden; deze satellieten bevinden zich 
36.000 km boven het aardoppervlak, de totale af-— 
stand kan dan ongeveer 80.000 km worden. Met een 
propagatiesnelheid van 300 km/msec komt men tot 
een looptijd van 260 msec per richting af 520 
msec vertraging. Wordt hierbij de verbinding tus- 
sen grondstation en abonnee meegerekend, dan komt 
men aan een vertraging van + 600 msec, Een van de 
gevolgen van de vertragingstijd kan als volgt toe- 
gelicht worden: Als A tijdens het spreken even 
pauseert om B de gelegenheid te geven te reageren, 


zal deze reactie pas na enige tijd bij A aankomen. 


Als dit te lang duurt gaat A inmiddels weer verder, 


de vertraagde reactie van B zal A onderbreken 
waarna gedurende enige tijd verwarring kan ont=- 
staan. Uit een aantal onderzoekingen (Klemmer '67, 
Brady '71, Höhne '72) kan afgeleid worden dat de 
looptijden van 600 — 1200 msec inderdaad verwar= 
ring veroorzaken, maar dat dit in het algemeen 
niet als bijzonder hinderlijk wordt ervaren. De 
vertraging die optreedt doordat men even op ant=- 
woord moet wachten wordt pas bij looptijden gro- 


ter dan 1200 msec hinderlijk. 
ECHO-ONDERDRIUKKERS 
De echo=onderdrukkers die momenteel toegepast wor- 


den bestaan in eerste benadering uit een spraakbe- 


stuurde schakelaar. Een verbinding met echo-onder- 


drukkers kan dan weergegeven worden als in fig. 3. 


Fig. 3: Vereenvoudigd schema van verbinding 


met echo=onderdrukker. 


De werking is als volgt: wanneer bij EN spraak 


gedetecteerd wordt, gaat de schakelaar 5, open 


A 
zodat de echoweg onderbroken is. Omdat er enige 


vertraging kan zijn tussen R‚ en Sr blijft 5, 


nog 50 msec open nadat de spraak bij R‚ verdwe- 
nen is. Bij de schakeling van fig. 3 is geen 
interruptie mogelijk, om hierin te voorzien wordt 


de schakeling uitgebreid volgens fig. á. 


Fig. 4: Principe-schema van echo=onderdrukker. 


In deze schakeling is een systeem V opgenomen dat er- 
voor dient z.g. tweezijdig spreken te detecteren; als 
dit optreedt wordt de blokkering S, opgeheven en wordt 


een demping L aan de R‚ zijde ingeschakeld. De bedoe- 


ling hiervan is de git ermee van de A-zijde door te 

laten, maar de echo voor de B-zijde te verzwakken met 

de demping L. 

Het zal duidelijk zijn, dat in deze situatie naar een 

compromis gezocht is, waarbij de spraak van B verzwakt 
doorkomt en de echo slechts gedeeltelijk wordt onder- 


drukt. De gevolgen van dit compromis worden hinderlij- 


ker naarmate de looptijd langer is (Karlin '67), zie 
fig. 5. 


1 : Percentage van het aantal abonnees 
dat moelijkheden ondervindt. 


II: Fercentage van het aantal abonneeg 


dat de verbinding als matig of 
slecht waardeert. 


Fig. 5: Resultaat praktijkproef met 
echo=onderdrukker. 


De hinderlijkheid wordt veroorzaakt door de combinatie 
van de in II genoemde looptijdinvloeden en de compromis 
effecten van de echo-onderdrukker, Het functioneren van 
de echo=onderdrukker wordt bovendien nog ongunstig be- 
Invloed door de grote niveauverschillen die in de prak- 
tijk optreden (harde en zachte sprekers, grote of kleine 


demping). 


IV, PRINCIPES VAN DE ADAPTIEVE ECHO-CANCELLER 


Bij deze wijze van echobestrijding wordt een model 
gevormd van de echoweg, zie fig. 6. Het uitgangs- 
signaal van dit model wordt afgetrokken van het 
werkelijke signaal en met behulp van dit verschil 
signaal wordt het model bijgeregeld om de echo te 
minimaliseren. Op deze manier is het mogelijk de 
echo te elimineren zonder de problemen, die inhe- 


rent zijn aan spraakbestuurde schakelaars, 


mode l- 
aanpassing 


Fig. 6: Principe van adaptieve echo-canceller. 


De aanpassing van het model moet gedurende het ge- 
sprek plaats blijven vinden, omdat de karakteristie- 
ken van de echoweg kunnen veranderen b.v. bij het 
doorverbinden in een huisautomaat of door een ver- 
andering in de akoestische overloop bij het toestel, 
die afhankelijk is van de stand van de handmicro- 
telefoon. 

Hoewel in theorie verschillende modelconfiguraties 
mogelijk zijn, is het meest gebruikte model, een 
transversaal filter, waarvan de weegfactoren ge= 
varieerd worden, Omdat dit op enige schaal en met 
voldoende nauwkeurigheid alleen digitaal is uit te 
voeren, kan het model als een discreet transversaal 


filter worden weergegeven (fig. 7). 


Fig. 7: Digitaal transversaal filter, 


Bij dit filter wordt het signaal op discrete tijd- 
stippen aan de ingang bemonsterd en het uitgangs 
signaal op dezelfde tijdstippen afgegeven. Een fil- 
ter K verwijdert de ongewenste produkten, De be- 
monsteringsfrequentie wordt volgens het bemonste- 
ringstheorema gevonden uit de bandbreedte. De ge- 
wenste bandbreedte is 3400 Hz, met enige marge 


wordt dit 4000 Hz, de bemonsteringsfrequentie moet 


Ì 
5000 125 Usec,. 


De weegfactoren 8, *** &, vormen de gediscretiseerde 


dan 2 x 4000 = 8000 Hz bedragen en T= 


impulsresponsie; het aantal elementen n wordt bepaald 
door de grootste lengte van de impulsresponsie, die in 
de echoweg kan optreden. Het gaat hier om de echo in 
het nationale telefoonnet en de lengte van de impuls- 
responsie kan voor verschillende landen een verschil- 


lende waarde hebben. Voor Nederland zal naar schatting 


25 
0,125 200, Om een 


eerste indruk te krijgen van de werking van de echo- 


25 msec voldoende zijn, n is dan 


canceller kan de vereenvoudigde voorstelling van fig. 8 
dienen, De echo-canceller bestaat uit een transversaal 
filter met coëfficiënten 8,» deze coëfficiënten worden 
berekend volgens de formule BY S Ke edt. Als reken- 
model voor de echoweg kan een transversaal filter met 


coëfficiënten h, dienen. Het uitgangssignaal van de 
n 
S ET: | Ed 
echo SORAAELAE 18 y= ve Ke Se het echosignaal is 
EE 7 E El 
Em % he De echo e is volledig gecompenseerd 
als Ek he voor k= | .……. n. 


signaal 


| echo-weg 
gecompenseerd 


Fig. 8: Vereenvoudigd schema van de echo=canceller met 
een rekenmodel van de echo-weg. 


Wanneer in eerste instantie alleen de componenten yy, en 


Zr in beschouwing worden genomen, met verwaarlozing van 


alle andere componenten y; en 8. (j = 1 «…. n) dan is 


uit fig. 8 gemakkelijk af te leiden dat voor dit deel- 
systeem Er convergeert naar ht Immers als B > he en 


x > 0 dan is Yi > z, en e < 0 dus xe < 0, voor XS 0 


k 
5 en: 
is dan ne 


k en e > 0 dus Xe < 0, Dus als 8, > hi 


dan is Xe altijd negatief, op dezelfde manier is in 
Len Sh itief ji dat 

te zien dat voor Ex h Ke positief 1s., Omdat 

Ee Jr en edt betekent dit dat 8, toeneemt als 


< 3 | 5 
Ey h, en dat Er afneemt als cn h,. Het stabiele 


punt is B > he waarbij de echo velledts gecompenseerd 
is. 

In werkelijkheid bevat het e=-signaal behalve het ver- 
schil van Yy ED 2 ook de verschilsignalen van de an- 
dere d. en 1 (JJ = 1 .….. n). Hoewel hierdoor de con- 
vergentie wordt vertraagd, kan bewezen worden dat het 
systeem onder normale omstandigheden convergeert 


(Sondhi '67). 
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Bij het echosignaal e moet nog een stoorsignaal n 
opgeteld worden, dit signaal bestaat uit ruis en 
spraak van de abonnee, die zich bij de echoweg be- 
vinden. Omdat Bef £ Xe (etn) dt en omdat x ongecor- 
releerd is met n kan de invloed van n gemiddeld 0 
zijn; de momentele invloed van n wordt bepaald door 
Y. Naarmate y kleiner is wordt de invloed van n 
kleiner, de convergentiesnelheid wordt echter ook 
kleiner zodat een compromis moet worden gezocht. 

Een nadeel van het beschreven systeem is, dat de 
snelheid waarmee En varieert evenredig is met het 
kwadraat van de grootte van het ingangssignaal (xe). 
Wanneer Xx, en e omgezet worden in een driewaardig 
signaal volgens fig. 9 treedt dit nadeel niet op, 
bovendien wordt hierdoor de vermenigvuldiger voor 


Ke sterk vereenvoudigd. 


Fig. 9: Vereenvoudiging van de vermenigvuldiger m 


Ì 


Voor kleine waarden van x en e is Fíx) en Fíe) = 0 
waardoor de invloed van ruis beperkt wordt; voor 
grotere waarden is F(x) en Fíe) + of =-1l, de grootte 
van het signaal is dan niet meer van belang. 

Naast bovenstaande gevoelsmatige benadering is ook 
een meer mathematische beschouwing van de adaptieve 
echo-canceller mogelijk. Uitgaande van fig. 8 kan 


geschreven worden: 


ja} 
| | - L =d " 
(T= 1} yít) je x(t) 8, 3 


n 
e(t) = z(t) — 12 x(t-j) g, 
Ditzelfde kan in vectornotatie geschreven worden 
met de vectoren P[t+IJ = [x(t), === x(ten+1)J 
BE) = [go gl 
> e(ttl) = z(ttI)} — (b(t+I).B(E)) 


De aanpassing kan nu geschieden door een verlies- 
functie V(9(E)) = J° (elt))° te minimaliseren. Dit 
is met een iteratief proces mogelijk volgens de gra- 
diëntmethode: Ö(t+I) = Ô(t) = y(t) grad V(O(t) 
V(bt) = [z(t+i) - ô(t+i) BCI 
grad [V(O(E))] = - [$(E+I)JT Ca(ttl) = d(t+I) 
8(t)] 
en Ö(t+1) = 8(t) + Y(t) Cô(e+1) [e(terl) — (E+N) 
8 (tE) 
Voor een constante waarde van y komt deze methode 


overeen met fig. B, 


B 


In de literatuur is een groot aantal methoden bekend 
om gunstige waarden voor y te bepalen. In de meest 
algemene benadering is y een tijdafhankelijke matrix. 
Bekend is b‚v, de "real time!" kleinste kwadraten- 
methode, die hier ter illustratie wordt gegeven 
(Äström '71) 
B(E+I) = Bt) + T(t) L(E+HI)] [a + Ô(t+I) p(t) 
TCD he 
T(t) = p(t) La + Ò(t+I) ple) Cô(E+IITT 
p(t+1) = [T - T(e) b(t+1)] p(t) 
Hierin is « een factor, die bepaalt hoe snel veran- 
deringen in Ö kunnen worden gevolgd, waarbij een 
grotere snelheid gepaard gaat met een grotere ge- 
voeligheid voor ruis. Overigens is het werken met 
de nxn matrix p in apparatuur moeilijk te realiseren 


bij waarden van n van + 200, 


„‚ PRAKTISCHE REALISATIE 


Ingewikkelde algoritmen zoals de in IV vermelde 
kleinste kwadratenmethode kunnen goed uitgevoerd 
worden met computersimulaties, Uitvoering in appara= 
tuur is echter moeilijk. Voor de verkenning die het 
Dr, Neher Laboratorium op dit gebied heeft uitge- 
voerd is dan ook gekozen voor een eenvoudig proef- 
model met een vertragingslijn van 40 stappen. Dit 

is onvoldoende om echo's in het Nederlands telefoon- 
net te bestrijden, maar voldoende voor een kennis=- 


making met de techniek van de echo=-canceller. 


Fig. 10: Blokschema van het DNL = proefmodel, 


Het blokschema is gegeven in fig. 10; ten opzichte 
van fig. 8 zijn de vertragingslijnen vervangen door 
circulerende schuifregisters X en G. Tussen twee 
samples in worden beide registers volledig gecircu- 
leerd en worden alle N produkten B, ä achtereen- 
volgens berekend en opgeteld, Voor spraak kan met 
dit model een overloopdemping van + 30 dB worden be= 
reikt in 5-10 woorden, 


Volgens de literatuur (Campanella '72) kan door een 
geschikte signaalbewerking een vorkoverloopdeming 
van meer dan 35 dB worden bereikt. Het restant van 
de echo kan dan met een z.g. center=clipper voor 


een groot deel worden verwijderd (fig. 11). 


ingangssignaal 


uitgangssignaal 


Fig. Ìl: Center — clipper. 


VI. ECHO-CANCELLERS IN DE PRAKTIJK 


Praktijkproeven op grote schaal met echo=cancellers 
zijn uitgevoerd door Intelsat (Suyderhoud '75). Uit 
de resultaten valt af te leiden dat de waardering 
van abonnees voor verbindingen met echo-cancellers 
slechts weinig beter is dan voor verbindingen met 
echo=onderdrukkers. Voor een deel is dit te wijten 
aan versluierende effecten zoals ruis en een te 
grote demping. In de toekomst is te verwachten dat 
de kwaliteit van telefoonverbindingen verbeterd zal 
worden. Het gevolg zal zijn dat echoverschijnselen 
beter merkbaar zijn en steeds meer een beperkende 
factor voor de kwaliteit zullen vormen, Hierdoor 
kan de behoefte aan een echo=canceller toenemen. 
Over het gebruik van 2 hops-satellietverbindingen 
met echo=-cancellers is nog weinig uit de praktijk 
bekend. Het is denkbaar dat deze mogelijkheid, het 
gebruik van echo-cancellers zal stimuleren. Een an- 
dere belangrijke factor is de prijsontwikkeling; 


het gebruik van de momenteel beschikbare IC's leidt 


tot een groot aantal componenten en een onaantrekke- 


lijke prijs. Voor serieproduktie zou een grotere 
mate van integratie noodzakelijk zijn. 

Een interessante gebruiksmogelijkheid van de echo- 
canceller is deze te bestemmen als meetinstrument, 
waarbij men de impulsresponsie van een systeem kan 
meten zonder gebruik te maken van testsignalen. Op 
deze wijze kunnen b.v. de karakteristieken van de 
vorkoverloopdemping worden bepaald zonder de abon- 


nee lastig te vallen. 
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L.P.C.-ANALYSE EN FORMANTSYNTHESE VAN SPRAAK 


1E: j En F. 


Willems 


Instituut voor Perceptie Onderzoek, Eindhoven 


In het kort worden hier de principes van een betrekkelijk nieuwe analyse-synthese-methode 


van spraak beschreven, met welke methode een goede kwaliteit van de gereproduceerde 


spraak is te bereiken (Linear Predictive Coding). Ten behoeve van het Fonetisch onderzoek 


geschiedt het synthetiseren met behulp van formanten. 


1) INLEIDING 
Het vinden van een representatie van spraak=- 
signalen in een aantal slechts langzaam 
variërende parameters is van groot belang voor 
een aantal toepassingen in het spraakonderzoek. 
De mens produceert een gering aantal (5 ä 10) 
spraakklanken per seconde, want de articulatoren 
en dus ook het spraakkanaal kunnen slechts met 
een beperkte snelheid bewegen. Ook het menselijk 
gehoororgaan, langs welke weg de spraak bij de 
mens binnenkomt » is beperkt wat betreft het 
verwerken van het aantal verschillende klanken 
per seconde. Uit dit soort van overwegingen is 
het plausibel te maken dat de informatie-inhoud 
van bijvoorbeeld PCM-gecodeerde spraak van 
48000 bits/sec (6000 Hz aftastfrequentie en 
8 bits per sample) aanzienlijk te reduceren is. 
ls ondergrond komt men tot ongeveer 60 bits/sec. 
(stelt men dat er 64 verschillende spraakklanken 
zijn, die in 6 bits zijn te coderen, en stelt 
men dat 10 spraakklanken per seconde worden ge=- 
produceerd, dan geeft dit 60 bits/sec.). 
Toepassingen van deze in de praktijk echter 
niet zo dramatische informatie=reductie bij 
spraaksignalen, liggen op het terrein van de 
spraakherkenning, van spraakopslag t.b.v. zoge= 
naamde voice response en van de overdracht van 
spraak. Op het gebied van de spraaktransmissie 
noemt men deze toepassingen: vocoders. Hoewel 
het idee van de vocoder uit de dertiger jaren 
stamt en in de tijd daarna er veel uitvoerings 
vormen van vocoders zijn voorgesteld (SCHRÖDER 
1966), zijn ze nooit op grote schaal toegepast, 
ofwel de bereikte bandbreedtereductie was te 
gering ofwel de kwaliteit van het uiteindelijke 
spraaksignaal was te slecht. De laatste jaren 
is de belangstelling voor vocoders weer toege= 
nomen, voornamelijk door de grote vlucht van de 
digitale technieken. Ook biedt de digitale vorm 
goede perspectieven voor geheime coderingen 
tijdens de spraakoverdracht. 


Een van de meer complexe, maar toch in de 


praktijk uitvoerbare analyse-synthese-technieken 
is de zog. Linear Predictive Coding: LPC afge- 
kort. (ITAKURA 1969, ATAL and HANAUER 1971). 

In het nabije verleden is aangetoond dat ener= 
zijds zeer goede kwaliteit van de spraak is te 
bereiken (ATAL) en anderzijds een grote band- 
breedtereductie tot beneden 1000 bits/sec is te 
behalen (SAMBUR 1975, KANG and COULTER 1970). 

De motivatie voor ons om aan dergelijke 
analyse-synthese-systemen te werken zijn de 
toepassingen ervan bij het fonetisch onderzoek. 
Bij studies omtrent de waarneming van spraak= 
klanken heeft de experimentator vaak behoefte 
aan stimuli, die volgens bepaalde voorschriften 
zijn gemaakt of gevarieerd. Het maken van derge= 
lijke stimuli kan geschieden m.b.v. analyse= 
synthese=systemen van spraak. Wil men de waar= 
neming van de intonatie van zinnen bestuderen, 
dan moet men de luisteraar (proefpersoon) zinnen 
kunnen voorspelen, waarin de intonatie systema= 
tisch wordt gevarieerd. Daartoe wordt de toon= 


hoogte (dat is de grondfrequentie van het bron= 


geluid) bij het syntheseproces vervangen door 
een kunstmatig opgewekt toonhoogteverloop, zoals 
dat door de experimentator wordt gevraagd. 

In deze bijdrage wordt een korte beschrijv= 
ing gegevens van deze LPC analyse-synthese- 
techniek. In de fonetiek is echter een beschrijv 
ing van spraakklanken in termen van de zog. 
formanten gebruikelijk. Formanten zijn de reso= 
nantiefrequenties van het mondkanaal. Bij een 
neutrale klinker van een mannenstem liggen de 
formanten resp. bij: 500 Hz eerste formant, 

1500 Hz tweede formant, 2500 Hz derde formant. 
De LPC techniek levert een goede mogelijkheid 

de analysegegevens om te rekenen naar een for- 
mantenbeschrijving. Zodoende kan het synthese- 
proces gebruik maken van deze in de fonetiek ge= 


kende Fformanten. 
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2) LINEAR PREDICTIVE CODING 

Hierbij gaat men uit van een productiemodel van 
spraak dat bestaat uit een bron, die ofwel een 
periodieke puls ofwel ruis produceert en een 


lineair filter dat alleen polen bevat (fig.la). 


JPRAAK 
In 


Fig. la. Spraakproductiemodel. 

Hoewel de overdrachtsfunctie van het mondkanaal 
in sommige gevallen ook nulpunten bevat en 
hoewel het brongeluid, dat door de stembanden 
wordt geproduceerd, niet pulsvormig van aard 
is, is het de veronderstelling dat met het ge- 
noemde model het spraakproductieproces voldoende 
nauwkeurig is te benaderen. Het filter dat 
alleen polen bevat is in fig. Ib voorgesteld als 


een recursief filter: 


bn 


Fig. Ib. Spraakproductiemodel als recursief 
filter. 
ook output spraaksample S. 


als de som van de input a en een lineaire com- 


binatie van een aantal spraaksamples Sasi uit 
het verleden: zi 
Sn ei tik I Ee Sn=j Ci) 


De lineaire combinatie van een aantal spraak 
samples uit het verleden is op te vatten als een 
voorspelling; vandaar de naam Linear Predictive 
Coding. De parameter M bepaalt de orde van het 
filter en is het aantal polen dat bij de be= 
nadering wordt gebruikt. M ligt in de praktijk 
tussen 10 en 15. De coefficienten a. voor 

Dm Ben Ki wen ‚‚M bepalen de overdrachtsfuncties 
en ze vormen samen met nog enkele andere para- 


meters ( Fo en stemhebbend- stemloos parameter) 
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kan worden geschreven 


een beschrijving van het spraaksignaal op een 
bepaald moment. De waarden van deze coefficienten 
en veranderen betrekkelijk langzaam en worden in 
de praktijk 100 of 50 per seconde bepaald. 

Bij de bepaling van de coefficienten a, gaat 
men uit van een stuk spraak van bijvoorbeeld 
25 ms, overeenkomend met 250 samples als met 
10 kHz wordt afgetast. Dit aantal noemen we N. 
De veronderstelling is dat het spraakkanaal ge- 
durende dat tijdsinterval als stationair is te 
beschouwen. Het stelsel coefficienten la} wordt 
uit dit stuk spraak door een minimaliserings= 
procedure bepaald. Dit geschiedt als volgt: 
Door de predictor (het filter) kan een spraak=- 
sample worden voorspeld. Daarbij treedt een fout 
op t.o.v, het spraaksample S. in het analyse= 


interval: 
M pi 
Ee 8 =D Ma Bn (2) 
Jel 
Door het minimaliseren van de gemiddelde kwadra- 


tische fout: LE) gem worden de coefficienten 
(a,} gevonden. 


M 
ä 2 
Eer ((s, en a, Sr-i rn 0 (3) 


voor Km 1,2 suse si ‚M. 


Hieruit volgt een stelsel vergelijkingen: 


5 a, Rix-3| = Rp voor K=el,2,....,M (4) 
j=l 
waarin 
N= l=k 
Red, 6-8 
E n=0 nm n+ k (5) 


Deze laatste grootheden R, zijn de auto=correlatie- 
coëfficienten van het stuk spraak in het analyse 
interval. De matrix die in dit stelsel vergelijk= 
ingen voorkomt is van een speciale vorm, waar- 

door het stelsel vergelijkingen recursief en snel 
is op te lossen. 

Aan de parameters nodig om het spraaksignaal 
compleet te beschrijven ontbreken nog enkele 
(fig. la), nl. de amplitude van het signaal, het 
gegeven of ruis of periodiek signaal als bron 
moet dienst doen en in het geval het bronsignaal 
periodiek is, is het nodig de herhalingsfrequentie 
ervan te kennen. Het meten van deze herhalings- 
frequentie is een probleem.waarop we later nog 
terugkomen. 

De voorspellen (het filter) die bij de be- 
paling van de coefficienten aj wordt gehanteerd 
wordt ook wel invers filter genoemd (fig. 2). 

De output van het filter als men de spraak op de 
input zet is immers (in de zin der kleinste kwa- 


draten) geminimaliseerd. Het inverse filter is 


grootheden. Bovendien is bekend dat een formant= 
beschrijving van spraak de zuinigste is wat be- 
treft informatie-inhoud. Een derde reden om naar 
een formantbeschrijving te zoeken is het feit 
dat er in ons laboratorium een digitale hardware 
formantensynthetisator aanwezig is, waarmee SYn- 
these in real-time mogelijk is. Daardoor krijgt 
de experimentator een snelle respons van het 
systeem, hetgeen enorme voordelen heeft. 

De overdrachtfunktie van een in serie ge= 
schakelde formanten synthetisator kan men 


schrijven als: (met 5 formanten) 


Ì 
Gíz) = 
(l+pj2 +qjz )Cl+psz +452 Veau) 


Willen we de spraak m.b.v. formanten resynti- 


Fig. 2. Voorspel=fout bij de analyse. 
6 e 3 7 seren, hetgeen we ons ten doel gesteld hebben 


dan cok op te vallen als een bewerking op het À Art 
dan moeten we het resultaat uit vergelijkingen 


ingangssignaal welke naar r tal pol 
Sânb 5 n vermogen (aantal polen (6) nog omrekenen naar p‚q — data volgens verg 


Hjhet speotens prdheert glad te wEriJ ken: (7). Voor dit doel zijn procedures bekend om 
kwadratische termen van een polynoom af te 
splitsen. 

3. HET ANALYSEPROGRAMMA 

Het computerprogramma, dat voor het berekenen 
van het inverse filter is ontwikkeld, ziet er 
in grote trekken als volgt uit. 

Het spraaksignaal is op de gebruikelijke wijze 
gedigitaliseerd. (laagdoorlaat-filter, sample 


and hold-schakelaar en conversie door een 12 


bits ADC), en is opgeslagen in het geheugen van 
de computer. De sample-frequentie bedraagt 
Fig. 3. Synthese-schema. 10 kHz, Voor een analyseslag worden 250 samples 


Het schema dat wordt gebruikt om de spraak genomen, overeenkomend met 25 ms. Allereerst 


m.b.v. deze beschrijving weer te resynthetiseren wordt het aantal nuldoorgangen in het analyse= 


(fles 3) corvespondeert vanrelfuprekend wat het interval geteld. Dit gegeven wordt gebruikt voor 


spraakproduktiemodel, dat ten grondslag ligt de beslissing of het signaal stemhebbend (perio= 


aan deze methode: De stemhebbend=- stemloosschake= diek: brongaluid gepaard gaand met een gering 


laar laat ofwel ruis ofwel een periodieke puls aantal nuldoorgangen) ofwel stemloos is (ruis 


met herhalingsfrequentie Fo toe tot de amplitude Ere DTONBKAUIE SE REOTE MUNCEE KITCOOTKERAMNAE 


modulator en daarna aan het variable filter. VEEVOLDENS VOTES HEE STEUNNL BEECHEENG EH HAD 
wordt preemphasis toegepast door een filter: 
P(z) = 1 = uz”) 


De constante U wordt voor een analyse interval 


De structuur van het variabelefilter kan 
allerlei vormen aannemen. De eenvoudigste struc- 


tuur is een recursief filter met de coefficien- 


ten ä, zoals in figuur Ib, Dat is een goede ee ze R 

manier voor de synthese van spraak en levert Hem 

goede kwaliteit van de spraak (Atal). Men kan Ko 

het recursieve filter schrijven als: Hierin zijn R, en Ro de eerste en nulde auto- 
Ì correlatiecoefficienten. Als de spraak stem= 


DEN me | 
l+ajz Î+agz Ê+azz°3t....tanzed (6) hebbend is, dan is U ongeveer | en het preem- 


Het nadeel van deze methode voor ons is, zoals phasis filter is dan een differentiatie. Bij 


in de inleiding werd aangeduid, dat ze niet stemloze klanken kan u gelijk =| worden en dan 


aansluit bij de formantstructuur die bij fone- is het preemphasis filter gelijk aan een inte- 


tici is ingeburgd. Veel spraakperceptie experi- grator. Het preemphasis filter moet er voor 


menten zijn gedaan met formanten als variabele zorgen dat toppen die in het spectrum voorkomen 
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ongeveer even hoog komen te liggen. Het preem= 
phasis filter is dan ook op te vatten als een 
invers filter van de eerste orde. Na deze be- 
werking wordt het stuk spraak vermeningvuldigd 


met een hammingwindow 


En ar 
He S, (+54 = +46 cos Nei ‚ met n=l....N. 


Deze bewerking is gebruikelijk om de ongewenste 
effecten van een rechthoekig venster te ver- 
mijden. Dan volgt het berekenen van het inverse 
filter met M=10. Daartoe worden 10 autocorre- 
latie coefficienten bepaald en wordt het stel- 
sel vergelijkingen (6) opgelost om de filter 
coëfficienten a, te vinden. Hiervoor 1s een 
snel en recursief algorithme ontwikkeld (MULLER 
1973). Zoals in paragraaf 2 is besproken wordt 
nu dit gevonden filter (van de vormen (6)) in 

5 kwadratische termen gesplitst, m.b.v. het 
Bairstow algorithme. Dit is een iteratieve 
procedure, die in een enkel geval geen kwadra- 
tische termkan vinden. In zo'n geval wordt de 
term, die bij het vorige analyse interval is 
gevonden daarvoor in de plaats gezet. Een veel 
belangrijker probleem is dat de polen niet 
steeds in een vaste volgorde worden gevonden, 
terwijl de formanten wel een ordening hebben. 
Daarom moeten de polen aan de formanten worden 
toegewezen. 

4. HET METEN VAN DE TOONHOOGTE. 

Het meten van de toonhoogte is ook een probleem 
waarvoor sinds decennia naar een oplossing wordt 
gezocht. Geen van de voorgestelde methoden 
werkt zonder fouten: de ene methode is zeer 
gevoelig voor de kwaliteit van het inputsignaal, 
de andere methode geeft fouten bij kleine sig- 
nalen en een derde is niet bestand tegen sig- 
nalen met een sterke tweede harmonische van de 
grondtoon, enz. 

Wij hebben een methode (aangevuld met nog een 
enkel idee) uit de literatuur (SONDHI 1968) ge- 
nomen, waarvan bekend is dat hij redelijk be- 
trouwbaar werkt. Voor het meten van de toon= 
hoogte wordt 35 ms (=350 samples) aan het in= 
Eangssignaal genomen, om er zeker van te zijn 
dat minstens twee periodes in het analyse-in= 
terval liggen. Dit signaal wordt (niet ge- 
windowed) center-geclipt en vervolgens wordt 

de autocorrelatiefunctie bepaald. De autocorre- 
latiefunctie wordt alleen berekend rondom de 
periode die wordt verwacht. Het maximum in de 
autocorrelatiefunctie wordt aangewezen als de 
periode in het ingangssignaal. De grootte van 
het interval waarin naar het maximum wordt ge=- 
zocht hangt af van de hoogte van de top in het 


vorige analyse-interval. Is de top hoog geweest 
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dan is dat een duidelijke periode geweest en 

dan wordt de breedte van dit venster smal gezet. 

Deze methode bespaart niet alleen rekentijd 

maar houdt ook rekening met een zekere conti= 

nuiteit die in het verloop van de natuurlijke 

toonhoogte aanwezig Ìs. 

5. SLOT OPMERKING 

Een korte inleiding werd gegeven van een analyse 

synthese-systeem gebaseerd op Linear Predictive 

Coding. Naast de genoemde eigenschap, dat de 

kwaliteit van de gereproduceerde spraak goed is 

zijn nog meer eigenschappen interessant die 

hier onbesproken moesten blijven. We noemen 

slechts: 

— De analyse is bestand tegen storing in het 
ingangssignaal: het minimaliseringsproces ver= 
loopt normaal, zij het met een iets grotere 
restfout. 

- De hier geschetste analysemethode levert een 
een filterpolynoom die altijd stabiel is. 

— Het filter is ook te schrijven als ladder- 
structuur, die equivalent is aan het mond= 
kanaal opgevat als akoestische buis. 

De theorie is in korte tijd (minder dan 10 
jaar) gegoeid tot een methode, die op bijna alle 
gebieden van het spraakonderzoek is doorgedrong- 
en als een gevestigd gereedschap (MARKEL & GRAY 
1970). 
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ANALYSE EN SYNTHESE VAN SPRAAK MIDDELS EEN BANDFILTERSYSTEEM 


Ir, Louis C‚W‚ Pols 


Instituut voor Zintuigfysiologie TNO, Soesterberg 


For the real-time analysis of speech we make use of a parallel set of bandfilters, which outputs 


are sampled every 10 msec, The raw spectral data are stored on the disk memory of a computer and can be 


used for subsequent data processing. 


However, these data can also be used for a real=time speech synthesis, The synthesis system, also 


based on a parallel set of bandfilters, gets its data from the computer and all synthesis parameters 


can be modified under program control, 


In this way not just the originally analyzed speech utterances can be regenerated with a good in= 


telligibility, but also any wanted part out of the text can be isolated and/or repeated for careful 


listening. If wished so, pitch, loudness, or pause duration can be modified, 


This system is very appropriate for generating stimuli for speech perception experiments, and is 


intensively used for studying vowel coarticulation effects, 


INLEIDING 


In relatie tot het thema van deze serie voordrachten, 
namelijk de "transmissie en synthese van spraak'', wordt 
bij analyse en synthese van spraak wellicht in eerste 
instantie gedacht aan de beschrijving van een systeem 
voor spraaktransmissie, al dan niet met een lage bitrate 
of bandbreedte, Er zijn echter nog andere redenen waarom 
men spraak zou willen analyseren en/of synthetiseren, 

Men kan spraak mmalyeeren om de fundamentele eigen=- 
schappen van het spraaksignaal en zijn dynamische varia= 
ties te onderzoeken, of om te komen tot automatische 
spraakherkenning, of spreker herkenning of =verifikatie, 
of men kan de verkregen informatie in een of andere vorm 
visueel of taktiel presenteren voor het spraakonderricht 
aan doven, 

Zonder voorafgaande analyse is het toch mogelijk 
spraak te synthetiseren via synthese door regels. Een 
dergelijk programmeerbaar synthesesysteem kan in het al- 
gemeen gebruikt worden voor signaalgeneratie, niet al- 
leen in de vorm van spraak maar eventueel b‚v, ook mu= 
ziek, 

Analyse plus ayntheae van spraak worden gekombi= 
neerd in spraaktransmissie systemen, al. dan niet inklu- 
sief spraakkodering, In het fundamenteel spraakonderzoek 
kan een dergelijk systeem echter ook met vrucht gebruikt 
worden voor de (evt, gedeeltelijke) hersynthese van een 
stuk spraak, waarbij dan al of niet een of meerdere pa= 
rameters kunnen worden gemodificeerd, Men kan hierbij 
denken aan intonatie- en koartikulatieonderzoek, Ook 
kunnen zo stimuli voor perceptieve proeven worden gege 
nereerd, 


Ten behoeve van het experimenteel spraakonderzoek 


op het I,Z,F, beschikten wij ook graag over een analyse 
synthese systeem dat aan de volgende eisen zou moeten 
voldoen: De synthetische spraak moest van een redelijke 
kwaliteit zijn, het systeem moest automatisch zijn en 
onder programmakontrôle kunnen worden gemanipuleerd. 

Het systeem moest liefst in real time werken en bij voor= 
keur gebaseerd zijn op een principe representatief voor 
de spraakperceptie, 

Onze keuze is hierbij gevallen op een kanaalvocoder= 
achtige benadering. Andere mogelijkheden vielen af door 
moeilijk te objektiveren analysemethodes (formantvocoder), 
of door de komplexiteit en de te grote computerbehoefte 
(LPC-vocoders), 

In de volgende paragraaf zal het systeem worden be- 
schreven waarna enkele toepassingen van het systeem frag= 


mentarisch zullen worden besproken, 


Beschrijving van het analyse=synthese systeem 


Zowel aan de analyse= als aan de synthesekant wordt ge= 
bruik gemaakt van een parallelle serie bandfilters. In 
plaats van een transmissieweg fungeert de computer als 
intermediaire opslag en aktieve datamanipulator, Veel va- 
riatie is mogelijk in het type filter, de onderlinge af- 
stand op de frekwentieschaal, de bandbreedte e‚d. Wij 
hebben ons bij onze keuze laten leiden door het beperkte 
frekwentieoplossend vermogen van het menselijk gehooror= 
gaan, uitgedrukt in de zogenaamde kritische bandbreedte 
(Plomp, 1976), Tertsfilters hebben een bandbreedte die 
goed hiermee overeenkomt, Van 400 Hz tot en met 8000 Hz 
hebben we hier dan ook gebruik van gemaakt, Teneinde de 
konstante kritische bandbreedte beneden ca, 400 Hz te si- 
muleren zijn nog drie 90-Hz filters met middenfrekwenties 


van 122, 215 en 307 Hz aan het systeem toegevoegd, Dit 
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resulteert in 17 filters, 


Analyse 


Aan de analysekant is aan. deze filters nog een breedban- 
dig filter (-3 dB punten bij 32 Hz en 8000 Hz) toege- 
voegd om het overall nivo van de spraak te kunnen meten. 
Deze filters worden gevolgd door logarithmische verster 
kers en omhullende piekdetektoren waarvan de parallelle 
uitgangen 100 keer per sek, worden bemonsterd met een 
20-kanaals multiplexer, Deze informatie gaat via een 
analoog=digitaal omzetter naar een PDP=15 computer, Voor 


een blokschema van het analysesysteem zie Fig. 1, 


LIN-C 


Fig. Ì, Blokschema van het analysesysteem, 


De ruwe data worden opgeslagen op een schijfgeheu= 
gen. Via diverse verwerkings= en displayprogramma's kun= 
nen deze data dan worden bestudeerd, De data kunnen, na 
eventuele modifikatie, ook gebruikt worden voor een ge- 
hele of gedeeltelijke hersynthese, Zowel analyse als syn- 
these gebeuren in real time, de tussenbewerkingen zijn 
echter off-line, Alvorens het synthesegedeelte te be- 
spreken zullen we enige voorbeelden geven van de verwer- 


kings- en displaymogelijkheden, 


Dataverwerking en parameterdisplay 


De ruwe gegevens per 1O-msek sample kunnen allereerst 

in de vorm van een getallendisplay worden weergegeven, 
Het verloop van iedere parameter kan ook als funktie 

van de tijd zichtbaar gemaakt worden, Fig, 2 is een voor- 
beeld van een dergelijke display, 

Door een pointer over het scherm te bewegen worden 
de numerieke waarden op ieder moment aangegeven in het 
rechter gedeelte van de display, Rechtsboven is het band- 
filterspektrum op het betreffende tijdmoment zichtbaar, 


Om het spektrale verloop als funktie van de tijd weer te 
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kunnen geven Is gebruik gemaakt van een datareduktie 
techniek, Hiertoe worden de 17 filterwaarden per 10=-msek 
sample beschouwd als de koordinaatwaarden van een punt 

in een 17-dimensionale ruimte. Ieder bandfilterspektrum 
is dan een punt in die ruimte, en opeenvolgende spektra, 
zoals in een woord, vormen een spoor in die ruimte. Met 
behulp van een principale=komponenten analyse (v.d. Geer, 
1967) kan nu een laag-dimensionale subruimte worden ge- 
definieerd waarin niettemin een zeer groot deel van de 
variatie in de oorspronkelijke data kan worden beschreven. 
Voor display doeleinden is een twee=dimensionale weerga= 


ve uiteraard het meest geeigend. 


onse LAMPLES 
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Fig, 3 geeft ter illustratie hiervan een weergave 
van de gemiddelde positie in de twee=-dimensionale subruim- 
te van een aantal klinkersegmenten geisoleerd uit eenlet- 
tergrepige woorden, Als klinkers zijn gekozen de Te, oe, 
en ad, Een dergelijke weergave vertoont veel verwantschap 
met die in het zogenaamde formantvlak, is echter ten op=- 
zichte van deze eenduidiger en, wat zeer belangrijk is, 
kan automatisch worden bepaald, 

Deze benadering biedt tevens de mogelijkheid tot 
een visuele representatie van de spektrale informatie ten 
behoeve van het spraakonderricht aan doven, Een eenvoudi- 
ger versie hiervan is in de praktijk met sukses getoetst 
(Povel, 1974), Vervolgens wil ik in het kort het synthe- 


se systeem beschrijven, 


Synthese 
Uit de literatuur is bekend (Flanagan, 1972) en beide 


eerste voordrachten hebben dat opnieuw aangetoond 
(Sluyter; Kuijk en Franssen, dit nummer), dat een voice- 
excited kanaalvocoder goede kwaliteit spraak kan pro- 


duceren, Deze benadering was echter voor ons type on= 


M, 


LIN 554 


Fo 147 


Fig. 2, Weergave van het tijdsafhankelijke verloop van een aantal parameters, zoals gefotografeerd van een compu- 


ter display, Van boven naar beneden is achtereenvolgens weergegeven: het overall nivo, de grondfrekwentie, het aantal 


nuldoorgangen, de afstand tussen opeenvolgende spektra in de 17-dimensionale ruimte, en stemhebbend/stemloos. Tevens 


zijn op de betreffende plaatsen de pauzeduren in msek aangegeven, De stippellijn is een verplaatsbare pointer, In de 


rechterhelft van de display zijn de met dat tijdmoment overeenkomstige numerieke waarden van de diverse parameters aan= 


gegeven, Tenslotte is rechts bovenin het momentane bandfilterspektrum weergegeven. Het stuk tekst waarvan hier de ana= 


lyseparameters zichtbaar zijn is: "Wie de sterkste was van …… ", 


derzoek, waarbij we ook de toonhoogte vrijelijk wilden 
kunnen modificeren, minder geschikt, Wij werken dan ook 
met een vaste periodieke of ruisbron, voor het genereren 
van de stemhebbende en stemloze spraakklanken, Echter in 
plaats van de uitgangen van de filters te moduleren, in= 
troduceren wij de spektrale variatie door het bronsig= 
naal zelf per filter te varieren, De synthetisator is 
een perifeer apparaat dat door middel van het op ons in= 
stituut ontwikkelde digitale input-output systeem vanuit 
de computer per 10 msek van nieuwe data wordt voorzien, 
waarna het apparaat zelfstandig de signaalgeneratie ver- 
zorgt, 

De voor de synthese benodigde toonhoogte informatie 
wordt tijdens de analyse verkregen middels een keelmi- 
krofoonsignaal, Door onder programmakontrôle de parame= 
ters nodig voor de synthese te modificeren kan de terug- 
gegenereerde spraak op vele manieren worden beïnvloed, 
do kan een klein gedeelte worden geisoleerd en in detail 
uitgeluisterd, door herhaald genereren en/of uitrekken 
van de tijdschaal, zonder spektrale vervorming. De bin= 
aen= en tussenwoord pauzes kunnen worden benadrukt door 
ze te verlengen, of juist geheel over te slaan, De into- 
natie van de zin kan worden gewijzigd door modifikaties 
in het verloop van de toonhoogte aan te brengen. 

Ook kan rekenkundig of eventueel in hardware een 


zatareduktie op de basisgegevens worden toegepast, waar= 


na hersynthese met een lagere bitrate kan worden gereali= 
seer, Tijdens de voordracht op 12 mei 1976 werden door 
middel van een bandopname een aantal van deze mogelijk- 
heden gedemonstreerd, 

Alhoewel flexibiliteit en eenvoudige modificeerbaar- 
heid eerste vereisten van het systeem zijn, willen we 
toch ook iets zeggen over de spraakverstaanbaarheid van 
teruggegenereerde spraak, De spraakverstaanbaarheid is 
op de beproefde wijze gemeten via lijsten met eenletter- 
grepige nonsens woorden (fonetisch gebalanceerd = PB 
words), ingesproken door vijf verschillende sprekers, en 
beluisterd door vijf verschillende luisteraars. De gemid= 
delde PB-word verstaanbaarheid bedraagt 77,8%. Dit is 
voor onze toepassingen ruim voldoende en garandeert een 
voortreffelijke zinsverstaanbaarheid, 

Wanneer datareduktie wordt toegepast neemt de woord- 
verstaanbaarheid uiteraard af, en wordt áá,1% wanneer 
J-dimensionale in plaats van de oorspronkelijke 17-dimen- 
sionale spektrale informatie wordt gebruikt. 

Òns systeem biedt ook de mogelijkheid tot een zoge- 
naamde pattern matching vocoder (Flanagan, 1972), Hierbij 
wordt gewerkt met een beperkt aantal diskrete spektra die 
gelabeled zijn, alleen deze nummers worden overgestuurd. 
In plaats van met diskrete spektra zou in ons geval met 
diskrete posities in een laag-dimensionale subruimte 


worden volstaan, 
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Fig. 3. Computer display van de gemiddelde posities 


van 18 klinkersegmenten geisoleerd uit eenlettergrepige 
woorden voor de klinkers te, ce, en aa, weergegeven in 


de tweedimensionale spektrale subruimte, 


Tot slot een summiere beschrijving van twee typen 
onderzoek waarvoor het analyse=synthese systeem wordt 
gekruikt, 

Onderzoek met het analyse-synthese systeem, 

Teneinde enig inzicht te krijgen in de belangrijkheid 
van bepaalde frekwentiegebieden voor de perceptie van be- 
paalde klinkers is een benoemingseksperiment uitgevoerd 
met selektief gemaskeerde klinkers. Met behulp van de 
synthetisator werden hiertoe korte klinkers gegenereerd 
waarbij de spektrale informatie in êên van de filters 
was vervangen door een band ruis. Als dit gebeurt in een 
frekwentiegebied dat niet erg bijdraagt tot de korrekte 
identificeerbaarheid van een bepaalde klinker, dan zal 
de maskering nauwelijks tot foutieve benoemingen leiden. 
Wanneer echter essentiele spektrale informatie wordt 
gemaskeerd dan zal dit leiden tot specifieke foutieve 
benoemingen (Pols, 1975). 

Een heel ander type onderzoek betreft de fysische 
en perceptieve verschillen tussen klinkers in eenletter- 
grepige woorden. De variabelen die hierbij een rol spe- 
len zijn de verschillnede Nederlandse klinkers, de ver- 
schillende sprekers, en de verschillende medeklinker- 
omgevingen waarin de klinkers kunnen worden geplaatst. 

Het analyse-synthese systeem wordt gebruikt voor 
het analyseren en isoleren van de klinkersegmenten, en 
voor ket hersynthetiseren van deze segmenten voor be- 
noemingsproeven. Niet alleen de tweeklanken et, au en ut 


blijken een sterk dynamisch verloop te hebben, maar ook 
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klinkers als de ee, oo en eu, waarvan het verloop zich 
dan ook nog sterk wijzigt als deze klinkers voorafgaan 


aan de Pr’, 


Soesterberg, mei 1976 
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De talrijke onderzoekingen op het gebied van deze com- 
missie betreffen het physische gedrag van het plasma in 
de magnetosfeer (dit is het gebied boven de ionosfeer 
alwaar de aanwezigheid van het aardmagneetveld wezenlijk 
Is voor de physische structuur van de ruimte). De het 
langst bekende hieronder vallende verschijnselen zijn de 
“whistlers!", vakterm voor de voortgeleiding van electro= 
magnetische golven van zeer lage frequentie (tot in het 
hoorbare gebied) langs de krachtlijnen van het aardmag- 
neetveld, Deze geleiding wordt bevorderd door de vor- 
ming van 'ducts", dit zijn ongeveer cilindrische buizen 
rondom bepaalde krachtlijnen waarbinnen de electronen- 
dichtheid het grootst is langs de as. Oorspronkelijk 
waren als bronnen van deze “whistlers!" slechts onweers- 


haarden in tropische gebieden bekend, terwijl hun ont=- 


vangst op aarde aan het einde van een magnetische kracht: 


lijn het eerst in 1888 geconstateerd werd als storende 
geluidjes op een lange telefoonlijn die effectief was 
als ontvangstantenne voor zeer lage frequenties. Later 
bleek dat de voor '"whistlers! karakteristieke voortge- 
leiding langs "ducts" zijn oorsprong even goed kan heb=- 
ben in locale magnetosferische verstoringen die veroor= 
zaakt worden door de wisselwerking van het ionosferische 
plasma met deeltjes van de daarop van boven invallende 
zonnewind, Recente op de conferentie in Lima behandelde 
onderzoekingen hebben vooral betrekking op kunstmatig 
(door injecties van stralen van geladen deeltjes) op=- 
gewekte whistlerverschijnselen. De resultaten daarvan 
verschaffen steeds meer inzicht in de physische ver= 
schijnselen die voortdurend in het magnetosferische 
plasma plaatsvinden, in het bijzonder in de wisselwer= 
king aldaar tussen electromagnetische golven onderling 
en tussen dergelijke golven en geladen deeltjes. De com- 
binatie van de vele aldus uitgevoerde experimenten leidt 
tot steeds uitvoeriger numerieke waarden van de iono= 
spherische parameters zoals electronendichtheid, elec= 
tronen en ionen temperaturen, boteings en recombinatie 
parameters, enz. Deze gegevens kunnen bovendien verge- 
leken worden met die afgeleid uit de waarnemingen van 
“incoherent scatting!' (genoemd door Vesseur, op pagina 
65 en 66). Een in het bijzonder in de laatste tijd ver- 
richt onderzoek houdt zich bezig met de aankomstrich= 
ting van op het aardoppervlak ontvangen whistlersigna- 
len; deze laatste waarnemingen verschaffen nieuwe gege- 
vens over de nog niet geheel begrepen wijze waarop een 
van de aarde afkomstige whistler het begin van een der 


bovengenoemde "ducts" bereikt, alsmede waarop deze na 


aankomst in het einde van deze duct het verderop gele- 
gen ontvangpunt bereikt. Ook werden in Lima programma's 
voor het toekomstige onderzoek van al deze verschijnse- 


len besproken. 


Prof. dr. H. Bremmer 


Technische Hogeschool Eindhoven 


UIT HET NERG 


L&DENMUTAT IES 


Voorgestelde leden 
Ir. PeBe Hesdahl, Faduaweg 75, Den Dolder. 


Ir: JeF. Kingma, Den Burghstraat 19, Voorburg dale 
Ir. Je Mendrik, Bosboom Toussaintplein 125, Delft. 


Nieuwe leden 

H.JeMiddendorp, Witbreuksweg 383-312, Znschede. 
Dipl. Ing. H.=G. Nussbaum, Jagersweg 4, Euizen ileHe 
Ir. WeJePeÂe Verbeek, Ursulaland 147, Den Haag. 
KeGe van Vliet, Jan Bollandlaan 21, Eindhoven. 

Ir. Jake Westerveld, Van Adrichemstraat 191, Delft. 
Ing. Ks. Zeehuisen, Donizettihof 25, Alphen aan de 


Rijn . 


Nieuwe adressen van leden 

Ir. CeAs Bruijnis, Zuiderdreef 51, Nieuw Vennep. 

Dre Íre Helse van Duuren, Raaphorstlaan 25, flat 

330, Wassenaar. 

Ir. Tele Jap, Noordeinde 5, Delft. 

Ir. Ce Kamminga, Nieuwe Plantage &7, Delft, 

Ir. LeP. Ligthart, Valenberg 63, Zoetermeer. 

Ir. Pete Reek, Faradijspoort 5l, Delft. 

Ir. Je van Staalduinen, Gebr. de Wittplantsoen 17, 
Voorschoten. 

Ir, Jelle Vleas, Nieuwe Vaart 10, Vleuten. 
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2 ND EUROPEAN SOLID STATE CIRCUITS CONFERENCE 
SEPTEMBER 21 - 24, 1976 
UNIVERSITE PAUL SABATIER, TOULOUSE - FRANCE 


PRELIMINARY PROGRAMME 
REGISTRATIONS 


LAAS CNRS 7, avenue du Colonel Roache, 31400 Toulouse, France 


Cosponsors 


Associazione Elettrotechnica ed Elettronica Italiana, European Physical Society, 

Convention of National Societies of Electrical Engineers of Western Europe, 

Institution of Electrical Engineers, The Nachrichtentechnische Gesselschaft 

im Verband Deutscher Elektrotechniker, The Nederlands Elektronica-En Radio- 

genootschap, the « Sociëté des électriciens, des &lectroniciens et des radio- 
êlectriciens », the « Sociëté frangaise de Physique ». 


Professional and financlal contributlons 


Centre National d'Etudes Spatiales, Centre National d'Etudes des Têlécommu- 
nications, Centre National de la Recherche Scientifique, Direction des Industries 
Electraniques et de Informatique, Dékégation Générale à la Recherche Scien- 
tifique et Technique, Institut de Recherche en Informatique et Automatique, 
Laboratoire edn ed et d'Analvse des Systêmes du CNRS, Laboratoire 
d'Electronique et des Techniques d'information CEA. 


Programme Committee 


Chairman : TJ. LACOUR (France) 

Vice Chairman : H. MARTINOT (France) \ Organizing Committee 
Secretary : D, ESTEVE (France) 

Members :_ _F BOREL (France) 


M. BRUNET (France) 

JT. CACHEUK (France) 

J.S. CAVE (Great Britain) 
E. COMSTANT (France) 

FP. DELIGME (France) 

C. DURANTE (France) 

WW. ENGL (Germany) 

GG. GRUNBERG (France) 
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PN. ROBSON (Great Britain 
K. STEIN (Germany) 
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Corresponding members: 


M. NAGATA (Japan) 
K. ZAININGER (U.S.A) 
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GENERAL INFORMATION 


‚General Organlzatlan 


— All sessions will be held in the Conference rooms of the « Université Paul 
Sabatier «, 118, Route de Narbonne, 31400 Toulouse. N 

— A hus service will operate between hotels and the Conference Place, 

— The reception service, where participants will obtain their documents, will 
be open fram Monday 20 September from 14h to IBh at the Entrance Hall 
af the « Université Paul Sabatier s, and Tuesday fram &h 30. r Be 
— The invited papers will preceed the sessions, certain of the sessions being 
arallel, English will be the official ade TT of the Conference, 

mening of the Conference: September 21, 1976 at $h 30. 


2, Documentation 


— À set summaries of the contributed papers will be given to the participants 
at the beginning of the Conference. 
— The « Invited Papers» will be published as a separate volume of the confe- 
rence series by the « Journal de Physiques A copy will be sent in the Spring 
af 1977 to all registered participants. Extra copies will be available fram the 
« Journal de Physique », 


3. Social eventa 


Social events, which will be planned by the Conference organizers, will take 
place throughout Conference: A webentlën on the evening of Tuesday 21 by 
the Mavor of Toulouse, an afternoon visit of Toulouse on Wednesday 22, and 
a Conference Banquet on Friday at noon. 

A ladies' programme will be arranged on request. 


4. Fees 
Registration fees for each participant have been fixed at 350 FF 


The registration fee includes: 
a set of summariës en 
the book of the invited papers, to be published in the Spring of 1977 
WEN Eat 3 days 
refr ents 
a bus service operating between hotels and the Conference place 


social events, 


For accompanving persons a contribution af 80 FF will be requested for the 
Conference Banquet. GE ‚ Ee 

Far students, who can justi their status, there will be a special fee of 
250 FF but which will not include participation in the social events, nor will 

they receive the book af the invited papers. 


5, Registrations 


Those wishing to participate are invited to complete the enclosed registration 
farm and return it to ESSCIRC 76 Secretariate, 


é. Hotel accomodations 


Your hotel reservation will be made through the « Syndicat d'Initiative« of 
Bor Beanie, lesser vete to the anchosure 
or details, east reier to INE EnClOSUIE. 8 
Fast conus tours will also be organized after the symposium by the « Syn- 
dicat d'Initiative ». 
6. Secretarlate 


The secretariate for the conference will be located as follows : 
until September 21, 1976 


LAAS CNRS 
7, avenue du Colonel-Roche 


31400 TOULOUSE (France 
Tel. : (61) SA.MLTT Telex : STLSE 520830 


from September 21 to 4 inclusive 


Université Paul Sabatier 
118, route de Marbanne 
41400 TOULOUSE (France) 


Tel. : (61) 52.15.95. 


LATE MEWS PAPERS 


The closing date far regular contributions was May 5. However late news 
papers may be submitted to the Program Committee. These should be no 
longer than five minutes presentation time. Abstracts of no more than 300 
words typed, double space, on one side of an A, should be submitted in 
duplicate to the general secretary of-the Conference: D. Estève, LAAS, CNRS. 
Motification of acceptance or rejection cannot be given to the contributors 
before conference time. 


Dons nenmmenehehd 


TUESDAY SEPTEMBER 21 


8,40 
10,30 
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PRELIMINARY PROGRAM 


Conference Spenlng 


Invite Pa in Watches - DE. VITTOZ - Centre Elec- 
tous lorlager - Neuchâtel 
rea 


SESSION |: TELECOMMUNIGATION ELECTRONICS 


1140 A-l-d 


1200 A-l-2 
1220 A-l-3 


12.40 
1200 - 14.00 
14.00 
SESSION Il: 
1500 A- 2-1 
15.20 A-dad 


1540 A-2-3 


16.00 

160 A-2-4 
1640 A-2-5 
IO A-Zsb 


1720 A-2-7 


High density monolithic bipolar and MOS crosspoint arrays 
far private branch telephone exchanges 


E. BACHLE - H, Ge 55 - J, DANGEL - G. KOHLBACHER - 


K. SCHLUTER - “SCHUSSLER - HJ. WULF - AEG TELE- 
FUNKEN 
An [2L bedie diallin er euk for telephony 


TC. KAIRE - GUETIK C La Radiotechnique Campelec - 

Caen - DIG. JANSSEN - K PHILIPS Gloeilampenfabrieken - 

Eindhoven 

Integrabie electronic gyrators with Ik efficiency 

Es desde Institut für Physikatische Elektronik Tech- 
nische - 


WW 
LATE NEWS PAPERS 
Lunch 


invited Paper: 
dimensions 
K.U. STEIN - 
Labarataries 


Semiconductor technologies with reduced 


D. WITMAN - SIEMENS - Munich Research 


INTEGRATED ELECTRONICS 


Mew ee, CMOS IC's based on weak inversion operation 

E. VITTOZ - J, FELLRATH -« Centre Electronique Horloger 

SA, - Neuchâtel 

A low drift MOSFET operational ampliber ARZ 

tn -= JM. ITTEL - J. BOREL - CEA CENG LETI - 
renG 


A differential MOS-bipolar voltage hbutfer with virtually zero 

input capacitance 

H. DE MAN - BH VAN PARIJS - R CUPPENS . Katholieke 

Universiteit Leuven - Laboratorium voor fysica en elektronica 

van de halfgeleiders - Heverlee 

Break 

A Mew circuit plee opis in voltage and temperature compen- 

sated emitter-caupled ORS 

W. WILHELM - SCHON - SIEMENS - Munich 

daer tuning of eaf toe En A en memory 
BOYCE - GJ, Plessey Semi- 

conductors - Swinden 

Maonalithie nuilor 

eis HUIJSING - JT, DE KORTE - Delft University of Techno- 


ned JFET wideband operational amplifier LC 
DL. CAVE - MP. DAVIS - Motorola - USA 


SESSION III: OPTOELECTRONICS 


16.15 B-3-1 


16.35 B-3-2 


16,55 B-3-3 


1715 B-3-4 


18.30 


4 bog ak monolithic charge-sensing circuit for paer ss 
RS - C. JUSSERET - Y. LEDUC -. D, C - 

M. BÖNNEJONNE © Université Catholique de ‘Louvain - Labao- 

ratoire de Microéêlectronique 

Eet an high-resolution imaging with three-terminal 


R. KOCH - SIEMENS « Munich 
tege use of junction isolation for photodetection in mano- 
ge rn optvelectronic circuits 

TOLD - 5, DERMITZAKIS - J, SURI - AEG TELE- 
FUNKEN - Heilbronn 
rai rt Garner zeen nition device { 

BELL . The Queen's University of 

Belfast 


Reception by the Mayor of Toulouse 


WEDNESDAY SEPTEMBER 22 


5,00 


Invited Pa From: where to where in logic arravs 
H. FLEIS ER - IBM Corporation - New Yor 


SESSION IV : MEMORIES 


10.00 A-4-1 
10,20 A-4-2 


100 A-4-3 
120 A-4-4 
1140 A-4-5 
1200 A-4-6 


1220 A47 


1240 


af a very large recon rable memory 
PM CHE TENSEMA Creebie 


Simple Al-gate- eeN iekds high bit-density 

An RG LLER - SIEMENS - Munich 
ea 

A lékilobit CCD memo 

J.N. GOODING - Allen Cleark Research Centre 


A léK MOS RAM with double-polysilicon technology 
R.W, MITTERER - B.F, REHN - SIEMENS - Munich 
rd fully decoded MNOS non-volatile memory 
BOSTOCK - Allen Clarck Research Centre 
A 1024 bits RMM ee with TTL compati te 
& Ni E GOASCOZ - CEA CENG LETI - 
renoble 

Project on an electrically reprogrammable fast read-out me- 
me sing bipolar tetrode transistors 

P. DOM Ph. ROUX - JL. A AUCOUTURIER - SEL Université 
de Bordeaux - M. DEPEY - SESCOSEM - Saint-Egrtve 
LATE NEWS PAPERS 


SESSION V : MODELING 


100OB-5-1 
1120 B-5-2 


1140 B-5-3 
1200 B-5-4 


1220 B-5 -5 


13.00 - 14.00 


ee nt for integrated circuit tolerance design 
E dede nr King's eere EE 
r E ec operation re merit for 
ie MLLER AP TEELEIDERER «KU. STEIN © SIEMENS - 


Mun 
A hi dE erformance LSI circuit design strategy 

LLOCK - Allen Research Centre - Towcester 
Thermal coupling phenomena in IC'S: Models re analysis 


ie nth: ES far circuits based on t ermal coup 
SZEKE K. TARNAY - Technical op Budapest 


k men far le einen of transfer inefficieney 
n charge ca evices 

LE USEMANN SE ‚ FROESCHLE - Technische Hochschule 
een 


Lunch 


THURSDAY SEPTEMBER 23 


900 Imvi per: Present and future af bi alar technol 
he \ VBLATD, - Allen Clark Research Centre EEN 
nvit aper vanced MOS technal 3 wi 
ri BOREL LETI echnalagies: A review 
11.00 Break 
SESSION VI: INTEGRATED INJECTIONS LOGICS 
IAS A-ó-1 agg ide AN reeEn lagic structures 
= 5 
IIB A-6-2 Stacked PL cir CNRS - Toulouse 
A - SKANEKO - T. OKABE - 
8 Laboratory of Hitach enal Eeen 
1155 A-6-3 Twin-transistar- ortie en el 5 
Be ERLE bn AMON ‚ HELIOUI - THOMSON 
5 
1215 A-6-4 Schottky IzL Caabetrate FED logic) - An optimum form of I2L 
P.S. WALSH - G.W, SUMERLING - Allen Clark Research Cen- 
tre - Towcester 
1245 A-6-5 Schottky collector ae lr: njection logic 
5. BLACKSTONE - NS - Université Catholique de 
Lauvain 
nn 
/ | per: Silicon on 5 hire technal 
Y. NISHI © Toshiba - Japan wdn eas 
SESSION Vil: MOS CIRCUITS 
15.00 A-7-1 rs” DECLERG S logic 
in ECLERCO Th. LAURENT - Université Catholique de 
uvain 
1520 A-7-2 N-channel- ss lengnterechnale far ri Tre er 
TJ. DANGEL - W. LANGHEINRICH - STEIN | 
„ AEG TELEFUNKEN | Ulm Ac STEEMAR 
600 A-7-3 Bret 
-T- treuit implications of the P.S.D-MOST process 
Ed EA: ke re nee Amie University af Technology 
EEL annel multiplexer on Ca hi 
TP. SUAT - G. MORIN - CEÂ CENG LETI . Grenobke 
1640 A-T-5 Resistance C-MOS circuit 
ie ate rn di E. VITTOZ - Centre Electronique Horloger SA. - 
euc 
1700 A-7-6 A CMOS/SOS technology for radiation RE devices 
TJ. PINEL - JM, CHA T - J.P, SUAT - 1, BOREL - CEA 
SESSION VII: DESIGH AND TESTING 
1600 H-4-1 Fault detection problems and their impact on the design of 
digital circuits 
ren M. COURVOISIER - J.C. GEFFROY - LAAS CHRS 
„ Toulouse 
1620 B-8-2 A standardized methad reduces design time of C-MOS inte- 
grated circuits and enables automatic checking 
C. BERTAILS - J. ZIRPHILE - SESCOSEM 
1640 B-8-3 D models of MOSFET ne and their parameter ac- 
BURO en an automatic syste 
BAYLAC - G. MERCKEL - CEA CEMNG LETI - Grenoble 
1700 B-8-4 re oe za Een end 
HAM niversity of South ta 
17.20 LATE NEWS PAPERS ae amie 


FRIDAY SEPTEMBER 24 8 


9.00 


10.00 


aken Kn ad High ed Ga As circuits 

R.V ge Laboratoire d'Electronique et de Physique Appli- 
LL 
reak 


SESSION IX: HIGH SPEED CIRCUITS 


10,20 A-9-1 
1040 A-9-2 
1.00 A-9. 


1120 A-9-4 


11.40 


a As integrated circuits for high speed logic 
BOCCON-GIBOD « G. DURAND © LEF 

Ga As MESFETs teations 

HJ. KLEIN « W. ENSKY - Anal University Aachen 

3 GHz logie based ons S GHz EE Ene 

M. KITCHIN - PS. WALSH - PI. ARD - ° Allen Clark Resarch 

Fn enge id A GH 

ravelling wave divi rs up ta z 

D. GRE 


B T 
D. KASPERKOVITZ - SEHILIPS Researches Laboratories - 
Een 

TE NEWS PAPERS 


SESSION X: COMPUTER ei DESIGH 


1020 B-10-1 
1040 B-10-2 


11.00 B-10-3 


1120 B-10-4 


1140 B-10-5 


1230 


Astec SE -= A user oriented circuit analysis program 
MH. H YDEMANN - CEA - Montrouge 
Episode - A set of tools oriented to logic integrated circuit 
5 er VERON and testing 
ICOIX - L.A.M. 


FO El 

KRUL ee moter alded lavour for MOS/LSI 
d Ws uter ä In OF 

H. BEKE - W. SÁNSEN VOVERSTRAETEN « Katho- 

lieke rr. berend 


CIRCEC: A cost-effective computer pr É td 
D. HERRERIAS - A. LABARPHE …% in 


Transient of nonlinear periodic transient (INPT) - A new 
HP STRO HEARD R. LAUR - I für T 

nstitut heoretische Elek. 
trotechnik - Aachen 
Conference Banquet 
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Inhoud | deel 4l — nr. 3 - 1976 


blz. 67 Eenvoudige vocoder voor Ee heee CE R.J. Sluijter 

blz. 73 nne leide dkee coder die ee 
voruitregeling dens íe. KE. Kuijk en Dr. Ie. N.V. 'ransser 

blz, 81 Aen denn van echo Ze telefoonlijnen, door Ir. EK. van Noort 

biz 87 LE: = Le en formantsynthese van spraak, door Ir. L.F. Willems 

se van Bor middels een bandfiltersysteem, door 


blz. 91 Analyse en synth 
Ir. L.C.W, polen 
blz. 95 URSI 


